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(54) Bezeichnung: VERFAHREN 2UR HERSTELLUNG VON BIOTIN 



(57) Abstract 

The invention relates to a genetic recombination product, containing an S-adenosyle-methionine-synthase gene, with the sequence 
SEQ ID no. 1 and a biotin biosynthesis gene bioSl, bioS2 and/or bioS3 with the sequences SEQ ID no. 3, SEQ ID no. 5 or SEQ ID 
no.7 and possibly at least one additional biotin synthesis gene sequence chosen from the group bioA, bioB, bioF, bioC, bioD, bioH, bioP, 
bioW, bioX, bioY or bioR. The invention also relates to organisms containing said genetic recombination product and to the use of same 
for producing biotin, as well as to a method for producing biotin. 



(57) Zusarnmenfassung 

Die Erfindung betrifft ein Genkohstrukt, enthaltend ein S-Adenosyl-Methionin-Synthasegen, mil der Sequenz SEQ ID No. 1 und ein 
Biotin-Biosynthesegen bioSl, bioS2 und/oder bioS3 mit den Sequenzen SEQ ID No.3, SEQ ID No.5 bzw. SEQ ID No.7 und gegebenenfalls 
mindestens einer weiteren Biotinsynthesegensequenz ausgewahlt aus der Gruppe bioA, bioB, bioF, bioC, bioD, bioH, bioP, bioW, bioX, 
bioY Oder bioR. Die Erfindung betrifft weiterhin Organismen, die dieses Genkonstrukt enthalten und die Verwendung des Genkonstrukts 
zur Herstellung von Biotin, sowie ein Verfahren zur Herstellung von Biotin. 
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Die Erfindung betrifft ein Genkonstrukt, enthaltend ein S-Adeno- 
syl-Methionin-Synthasegen, mit der Sequenz SEQ ID No. 1 und ein 
Biotin-Biosynthesegen bioSl, bioS2 und/oder bioS3 mit den Sequen- 
zen SEQ ID No. 3, SEQ ID No . 5 bzw. SEQ ID No. 7 und gegebenenf alls 
mindestens einer weiteren Biotinsynthesegensecjuenz ausgewahlt aus 
der Gruppe bioA, bioB, bioF, bioC, bioD, bioH, bioP, bioW, bioX, 
bioY oder bioR. Die Erfindung betrifft weiterhin Organismen, die 
dieses Genkonstrukt enthalten und die Verwendung des Genkon- 
strukts zur Herstellung von Biotin, sowie ein Verfahren zur Her- 
15 stellung von Biotin. 



10 



Ais Coenzym spielt Biotin (Vitamin K) eine essentielle Rolle bei 
enzymkatalysierten Carboxylierungs- und Decarboxylierungsreaktio- 
nen. Biotin ist damit ein essentieller Faktor in lebenden Zellen. 

2 ^ Biotin mu& von fast alien Tieren und einigen Mikroorganismen von 
au£en aufgenommen werden, da sie Biotin nicht selber synthetisie- 
ren konnen. Es ist damit fur diese Organismen ein essentielles 
Vitamin. Bakterien, Hefen und Planzen hingegen konnen Biotin aus 
Vorstufen selbst synthetisieren (Brown et al. Biotechnol. Genet. 

25 Eng. Rev. 9, 1991: 295 - 326, DeMoll, E. , Escherichia coli and 
Salmonella, eds . Neidhardt, F. C. et al. ASM Press, Washington 
DC, USA, 1996: 704 - 708, ISBN 1-55581-084-5). 



Die Biotinsynthese wurde in bakteriellen Organismen speziell im 

^° gramnegativen Bakterium Escherichia coli und im grampositiven 
Bakterium Bacillus sphaericus untersucht (Brown et al. Biotech- 
nol. Genet. Eng. Rev. 9, 1991: 295 - 326). Als erstes bisher be- 
kanntes Intermediat in E. coli wird Pimelyl-CoA (PmCoA) angese- 
hen, das aus der Fettsauresynthese starnmt (DeMoll, E. , Esche-ri— 

35 chia coli and Salmonella, eds. Neidhardt, F. C. et al . ASM Press, 
Washington DC, USA, 1996: 704 - 708, ISBN 1-55581-084-5 1996). 
Der Syntheseweg dieser Biotin-Vorstuf e in E. coli ist bisher 
weitgehend unbekannt (Lemoine et al . , Mol. Microbiol. 19, 1996: 
645 - 647) . Es wurden mit bioC und bioH zwei Gene identif iziert , 

40 deren korrespondierende Proteine fur die Synthese von Pm-CoA ver- 
antwortlich sind. Die enzymatische Funktion der Genprodukte BioH 
uhd~B"ioC~ist — bisher ni~chrt~~bekahhx (Ijemo^ihe et alT^ Mol~Micfro- 
biol.- 19, 1996: 645 - 647, DeMoll, E. , Escherichia coli and Sal- 
monella, eds. Neidhardt, F. c. et al. ASM Press, Washington DC, 

45 USA, 1996: 704 - 708, ISBN 1-55581-084-5). Pm-CoA wird in vier 
weiteren enzymatischen Schritten zum Biotin umgewandelt. Ausge- 
hend vom Pm-CoA findet zuerst die Kondensation mit Alanin zu 
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, 7-Keto-8-Amino-Pelargpnsaure (KAPA) durch BioF statt. Es folgt 
die Umsetzdn^ vdn KAPA zu 7,8 Diamino-Pelargonsaure (DAPA) durch 
BioA. Der nachste Schritt fuhrt nach einer ATP-abhangigen Carbo- 
xylierungsreaktion zum Dethiobiotin (DTB) und wird durch BioD ka- 

5 talysiert. Im letzten Schritt findet die Umsetzung von DTB zu 
Biotin statt. Dieser Schritt wird durch BioB katalysiert. Der 
chemische und enzymatische Mechanismus der Umwandlung von DTB zu 
Biotin ist bisher nur unvollstandig verstanden und aufgeklart. 



10 Eine Charakterisierung der Umwandlung von DTB zu Biotin wurde 
bisher ausschliefclich in bakteriellen bzw. pflanzlichen Zellex- 
trakten durchgefuhrt (WO94/8023, EP-B-0 449 724, Sanyal et al . 
Arch. Biochem. Biophys . , Vol. 32 6, No. 1, 1996: 48 - 56 und Bio- 
chemistry 33, 1994: 3625 - 3631, Baldet et al . Europ. J. Biochem. 

15 217, 1, 1993: 479 - 485, Mejean et al . Biochem. Biophys. Res. 

Commun., Vol. 217, No. 3, 1995: 1231 - 1237, Ohshiro et al., Bio- 
sci. Biotechnol. Biochem., 58, 9, 1994: 1738 - 1741). 

In vitro Studien haben gezeigt, da£ niedermolekulare Faktoren wie 
20 NADPH, Cystein, Thiamin, Fe 2+ , Asparagin, Serin, Fruktose 

1-6-bisphosphat und S-Adenosylmethionin die Synthese von Biotin 
stimulieren konnen (Ohshiro et al., Biosci. Biotechnol. Biochem., 

58, 9, 1994: 1738 - 1741, Birch et al., J. Biol. Chem. 270, 32, 
1995: 19158 - 19165, Ifuku et al . , Biosci. Biotechnol. Biochem., 

25 59, 2, 1995: 185 - 189, Sanyal et al . Arch. Biochem. Biophys. 
326, 1, 1996: 48 - 56) . 

Neben diesen niedermolekularen Faktoren wurden weitere Proteine 
identif iziert, die die Synthese von Biotin aus DTB in Gegenwart 
von BioB stimulieren. Dabei handelt es sich urn Flavodoxin und 
30 Flavodoxin-NADPH-Reduktase (Birch et al . , J. Biol. Chem. 270, 32, 
1995: 19158 - 19165, Ifuk et al., Biosci. Biotechnol. Biochem., 

59, 2, 1995: 185 - 189, Sanyal et al., Arch. Biochem. Biophys. 
326, 1, 1996: 48 - 56). Weitere Proteine, die eine Stimulation 
der Biotinsynthese bewirken, sind die in der deutschen Anmeldung 

35 mit der Anmeldenummer 197.31274.8 (Prioritat 22.7.97) beschriebe- 
nen Gene bioSl und bioS2 . 

Uber die Herkunft des Schwefels im Biotinmolekul existieren un- 
terschiedliche Ergebnisse. Bei Untersuchungen der Biotinsynthese 

40 in Gesamtzellextrakten wurde gezeigt, da£ in Gegenwart von 35 S- 
markiertem Cystein Radioaktivitat in Biotin inkorporiert wurde; 
weder mit 35s-markiertem Methionin noch mit S-Adenosyl-Methionin 
konnte ein Schwef el-Einbau ins Biotinmolekul nachgewiesen werden 
(Ifuku et al., Biosci. Biotechnol. Biochem. 59, 2, 1995: 184 - 

45 189, Birch et al., J. Biol. Chem. 270, 32, 1995: 19158 - 19165). 



Die fur die beschriebenen Proteine kodierenden Gene bioF, bioA, 
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bioD, und bioB sind in E. coli auf einem bidirektionalem Operon 
kodiert. Dieses Operon liegt zwischen der A,-attachement-site und 
dem uvrB Gen Locus bei ca. 17 Minuten auf dem E. coli Chromosom 
(Berlyn et al. 1996: 1715 - 1902). Auf diesem Operon sind zusatz- 

5 lich noch zwei weitere Gene kodiert, von denen das eine, bioC, 
bereits beschriebene Funktionen in der Synthese von Pm-CoA hat, 
wahrend einem of fenen Leseraster hinter bioA bisher keine Funk- 
tion zugeordnet werden konnte (WO94/8023, Otsuka et al . , J. Biol. 
Chem. 263, 1988: 19577 - 85). Hoch konservierte Homologe zu den 

q e. coli Proteinen BioF, A, D, B wurden in B. sphaericus, B. sub- 
tilis, Syneccocystis sp. (Brown et al. Biotechnol. Genet. Eng. 
Rev. 9, 1991: 295 - 326, Bower et al . , J. Bacteriol. 175, 1996: 
4122 - 4130, Kaneko et al . , DNA Res. 3, 3, 1996: 109 - 136), Ar- 
chaebakterien wie Methanococcus janaschi, Hefen wie Saccharomyces 

5 cerevisiae (Zhang et al.. Arch. Biochem. Biophys . 309, 1, 1994: 
29 - 35) oder in Pflanzen wie Arabidopsis thaliana (Baldet et 
al., C. R. Acad. Sci. Ill, Sci. Vie. 319, 2, 1996: 99 - 106)) ge- 
f unden . 



Die Synthese von Pm-CoA scheint in den beiden bisher untersuchten 
gram-positiven Mikroorganismen anders zu verlaufen als in E. 
coli. Es konnten keine Homologen von bioH und bioC gef unden wer- 
den (Brown et al. Biotechnol. Genet. Eng. Rev. 9, 1991: 295 - 
326) . 

Biotin ist eine optisch aktive Substanz mit drei Chiralitatszen- 
tren. Es wird bisher wirtschaf tlich nur uber eine vielstufige, 
teure chemische Synthese hergestellt werden. 



30 Alternativ zu dieser chemischen Synthese wurde eine Vielzahl von 
Versuchen unternommen, ein f ermentatives Verfahren zur Herstel- 
lung von Biotin mit Mikroorganismen aufzubauen. Durch Klonierung 
des Biotin-Operons auf multi-copy-Plasmide konnte die Biotinsynt- 
hese in den mit diesen Genen transf ormierten Mikroorganismen er- 

35 hoht werden. Eine weitere Erhohung der Biotinsynthese wurde durch 
die Deregulierung der Biotingenexpression uber die Selektion von 
birA-Mutanten erreicht (Pai C. H. , J. Bacteriol. 112, 1972: 1280 
- 1287) . Die Kombination beider Ansatze, das heifit die Expression 
der Plasmid-kodierten Biosynthesegene in einem regulationsdef i- 

40 zienten Stamm (EP-B-0 236 429), brachte eine weitere Steigerung 
der Produktivitat . Das Biotin-Operon kann dabei entweder unter 

Kontrol-l-e-seines-nativen-bidi-rekt-ionalem-P^^^ 

(EP-B-0 236 429), oder seine Gene konnen unter die Kontrolle ei- 
nes extern regulierbaren Promotors gebracht werden ( WO94/08023 ) . 

45 

Durch die bisher verfolgten Ansatze zur f ermentativen Herstellung 
von Biotin in E. coli konnte keine wirtschaf tlich ausreichende 
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Produktivitat erreicht werden. 



Aufgabe der vorliegenden Erfindung war es, ein technisches, fer- 
mentatives Verfahren zur Herstellung von Biotin zu entwickeln, 
5 da£ eine moglichst hohe Biotinsynthese zeigt. 

Diese Aufgabe wurde durch das erf indungsgemafce Verfahren zur Her- 
stellung von Biotin, dadurch gekennzeichnet , daS man ein S-Adeno- 
syl-Methionin-Synthase(SAM-Synthase)-Gen mit der Sequenz SEQ ID 

10 No. 1 und mindestens ein wei teres Biotin Biosynthesegen bioSl, 

bioS2 Oder bioS3 mit den Seguenzen SEQ ID No. 3, SEQ ID No. 5 und 
SEQ ID No. 7 sowie ihre f unktionellen Varianten, Analoge Oder De- 
rivate in einem prokaryontischen oder eukaryontischen Wirtsorga- 
nismus, der in der Lage ist Biotin zu synthetisieren, exprimiert, 

15 diesen zuchtet und das synthetisierte Biotin direkt, nach Abtren- 
nung der Biomasse oder nach Reinigung des Biotins verwendet, ge- 
lost . 

Die im erf indungsgemaSen Verfahren verwendeten Gene, das SAM-Syn- 
20 thase-Gen mit der Sequenz SEQ ID No. 1 und die Biotin-Biosynthe- 
segene bioSl, bioS2 und bioS3 mit den Sequenzen SEQ ID No. 3, 
SEQ ID No. 5 und SEQ ID No. 7 werden in der SwissProt-Datenbank 
unter den w Accession" -Nummern P04384 (metK), U29581 (bioSl), 
P39171 (bioS2) und D90811 (bioS3) gefiihrt. In der Datenbank sind 
25 eine Reihe von Homologen zu MetK aus E. coli beschrieben. Diese 
Homologe umfassen Organismen wie weitere Eubakterien (z.B. H. in- 
fluenza, B. subtilis) , wie auch Eukaryonten (z.B. Hefen: S. cere- 
visiae, Planta: P. deltoides, Arthropoda D. melanogaster , und 
Mammalia: R. norvegicus) . 

Durch Expression einer oder mehrerer des SAM-Synthase-Gens mit 
der Sequenz SEQ ID No. 1, seiner f unktionellen Varianten, Analoge 
oder Derivate in Kombination mit mindestens einem der Biotinsy- 
thesegene bioSl, bioS2 oder bioS3 mit den Sequenzen SEQ ID No. 3, 

35 SEQ ID No. 5 und SEQ ID No . 7 sowie deren funktionelle Varianten, 
Analoge oder Derivate in einem prokaryontischen oder eukaryonti- 
schen Wirtsorganismus laSt sich die Produktivitat der Biotinbio- 
synthese deutlich steigern. Bevorzugt wird wird eine Kombination 
von SAM-Synthase-Gen und biosl zur Expression verwendet. Vorteil- 
haf terweise wird fur eine gesteigerte Biotinsynthese gleichzeitig 

*° mindestens ein weiteres Biotingen ausgewahlt aus der Gruppe bioA, 
bioB, bioF, bioC, bioD, bioH, bioP, bioW, bioX, bioY oder bioR 
mit exprimiert. Durch die Expression der Gene wird die Synthese 
von Biotin urn mindestens den Faktor 2 gegenuber der Kontrolle 
ohne diese Gene, bevorzugt urn einen Faktor grower 3, gesteigert. 

45 
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Nach isolierung und Seguenzierung sind die im erf indungsgemaSen 
Verfahren verwendeten Gene, das SAM-Synthase-Gen mit der Nukleo- 
tidsequenz SEQ ID No. 1, das bioSl Gen mit der Nukleotidsequenz 
SEQ ID No. 3, das bioS2 Gen mit der Nukleotidsequenz SEQ ID No. 5 
5 und das bioS3 Gen mit der Nukleotidsequenz SEQ ID No. 7 erhalt- 
lich, die fur die in SEQ ID NO: 2, respektive SEQ ID No. 4, re- 
spektive SEQ ID No. 6 und SEQ ID No. 8 angegebenen Aminosaurese- 
quenzen oder deren Allelvariationen kodieren. Unter Varianten 
sind SEQ ID No. 1-, SEQ ID No. 3- bzw. SEQ ID No . 5 , respektive SEQ 

10 ID No. 7 -Variant en zu verstehen, die 30 bis 100 % Homologie auf 
Aminosaureebene, bevorzugt 50 bis 100 %, ganz besonders bevorzugt 
80 bis 100 % aufweisen. Allelvarianten umfassen insbesondere 
funktionelle Varianten, die durch Deletion, Insertion oder Sub- 
stitution von Nukleotiden aus den in SEQ ID NO: 1, SEQ ID No. 3, 

15 SEQ ID No. 5 und SEQ ID No . 7 dargestellten Sequenzen erhaltlich 
sind, wobei die enzymatische Aktivitat aber erhalten bleibt. 

Weiterhin sind unter Varianten auch funktionelle Aquivalente der 
Gene wie die O-Acetyl-serinsulf ohydrolase A, die O-Acetyl-serin- 

20 su If ohydrolase B, die p-Cystathionase (siehe Flint et al . , J. 
Biol. Chem., Vol. 271, 1996: 16053 - 16067) oder nifS und seine 
prokaryontischen und eukaryontischen Homologen beispielsweise aus 
Klebsiella, Candida, Hefen oder aus Caenorhabditis zu verstehen, 
die in der Lage sind die enzymatische Aktivitat von bioSl, bioS2 

25 oder bioS3 in der Biotinsynthese zu tibernehmen. 



Unter f unktionellen Analogen von SEQ ID NO: 1, SEQ ID NO: 3, 
SEQ ID NO: 5 und SEQ ID No. 7 sind beispielsweise ihre prokaryon- 
tischen oder eukaryontischen Homologen wie bakterielle, pilzli- 
° che, pflanzliche, tierische oder menschliche Homologen zu verste- 
hen. Unter Analogen sind weiterhin auch verkiirzte Sequenzen, Ein- 
zelstrang-DNA oder RNA der codierenden und nichtcodierenden DNA- 
Sequenz zu verstehen. 

Derivate sind beispielsweise Promotorvarianten zu verstehen. Die 
Promotoren, die den angegebenen Nukleotidsequenzen vorgeschalten 
sind, konnen durch ein oder mehrere Nukleotidaustausche, durch 
Insertion(en) und/oder Deletion(en) verandert sein, ohne dafc aber 

0 die Funktionalitat bzw. wirksamkeit der Promotoren beeintrachtigt 
wird. Des weiteren konnen die Promotoren durch Veranderung ihrer 

— Sequenz— in-i i-h-rer— W-i-r-ksamkei-t- erhoht^oder. komple tt durch wi rksa- 

mere Promotoren auch artfremder Organismen ausgetauscht werden. 



45 Unter Derivaten sind auch .Varianten zu verstehen, deren Nukleo- 
tidsequenz im Bereich von -1 bis -30 vor dem Startkodon so veran- 
dert wurden, daS die Genexpression und/oder die Proteinexpression 
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erhoht wird. Vorteilhaf terweise geschieht dies durch eine veran- 
derte Shine-Dalgarno-Sequenz . 



Als prokaryontische Wirtsorganismen des erf indungsgemafcen Verfah- 
5 rens kommen prinzipiell alle Biotin synthetisierenden gram-nega- 
tiven Oder gram-positiven Bakterien in Frage. Als gram-negative 
Bakterien seien beispielhaft Enterobacteriaceae wie die Gattungen 
Escherichia, Aerobacter, Enterobacter , Citrobacter, Shigella, 
Klebsiella, Serratia, Erwinia Oder Salmonella, Pseudomonadaceae 

10 wie die Gattungen Pseudomonas, Xanthomonas, Burkholderia, Gluco- 
nobacter, Nitrosomonas, Nitrobacter, Methanomonas, Comamonas, 
Cellulomonas oder Acetobacter, Azotobacteraceae wie die Gattungen 
Azotobacter, Azomonas, Beijerinckia oder Derxia, Neisseriaceae 
wie die Gattungen Moraxella, Acinetobacter, Kingella, Neisseria 

15 oder Branhamella, die Rhizobiaceae wie die Gattungen Rhizobium 
oder Agrobacterium oder die gram-negat i ven Gattungen Zymomonas, 
Chromobacterium oder Flavobacterium, genannt. Als gram-positive 
Bakterien seien beispielhaft die Endosporen-bildenden gram-posi- 
tiven aeroben oder anaeroben Bakterien wie die Gattungen Bacil- 

20 lus, Sporolactobacillus oder Clostridium, die corynef ormen Bakte- 
rien wie die Gattungen Arthrobacter , Cellulomonas, Curtobacte- 
rium, Corynebacterium, Brevibacterium, Microbacterium oder Kurt- 
hia, die Actinomycetales wie die Gattungen Mycobacterium, Rhodo- 
coccus, Streptomyces oder Nocardia, die Lactobacillaceae wie die 

25 Gattungen Lactobacillus oder Lactococcus, die gram-positiven Kok- 
ken wie die Gattungen Micrococcus oder Staphylococcus, genannt. 



Bevorzugt werden Bakterien der Gattungen Escherichia, Citrobac- 
ter, Serratia, Klebsiella, Salmonella, Pseudomonas, Comamonas, 

30 Acinetobacter, Azotobacter, Chromobacterium, Bacillus, Clostri- 
dium, Arthrobacter, Corynebacterium, Brevibacterium, Lactococcus, 
Lactobacillus, Streptomyces, Rhizobium, Agrobacterium oder Sta- 
phylococcus im erf indungsgemafien Verfahren verwendet. Besonders 
bevorzugt werden Gattungen und Arten wie Escherichia coli, Citro- 

35 bacter freundii, Serratia marcescens, Salmonella typhimurium, 

Pseudomonas mendocina, Pseudomonas aeruginosa, Pseudomonas muta- 
bilis, Pseudomonas chlororaphis , Pseudomonas fluorescens, Comamo- 
nas acidovorans, Comamonas testosteroni , Acinetobacter calcoace- 
ticus, Azotobacter vinelandii, Chromobacterium violaceum, Bacil- 

-A lus subtilis, Bacillus sphaericus, Bacillus stearothermophilus , 
4 0 

Bacillus pumilus, Bacillus lichenif ormis, Bacillus amyloliquef a- 
ciens, Bacillus megaterium, Bacillus cereus, Bacillus thuringien- 
sis, Arthrobacter citreus, Arthrobacter paraffineus, Corynebacte- 
rium glutamicum, Corynebacterium primorioxydans , Corynebacterium 
sp., Brevibacterium ketoglutamicum, Brevibacterium linens, Brevi 
45 bacterium sp., Streptomyces lividans, Rhizobium leguminosarum 
oder Agrobacterium tumefaciens. Vorteilhaf terweise werden Bakte- 
rien verwendet, die schon eine erhohte naturliche Biotinproduk- 



4 
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Die taxonomische Stellung der aufgefiihrten Gattungen unterlag in 
den letzten Jahren einem starken Wandel und befindet sich noch 
5 immer im FluS, da falsche Gattungs- und Artnamen korrigiert wer- 
den. Aufgrund dieser in der Vergangenheit haufig erf orderlichen 
taxonomischen Umgruppierungen der genannten Gattungen innerhalb 
der bakteriellen Systematik sind auch andere als die oben genann- 
ten Familien, Gattungen und Arten fur das erf indungsgemafie Ver- 
io fahren geeignet. 

Als eukaryontische Wirtsorganismen des erf indungsgemafcen Verfah- 
rens kommen prinzipiell alle Biotin synthetisierenden Organismen 
in Frage wie Pilze, Hefen, Pflanzen oder pflanzliche Zellen. Als 

15 Hefen seien die Gattungen Rhodotorula, Yarrowia, Sporobolomyces, 
Saccharomyces oder Schizosaccharomyces bevorzugt genannt. Beson- 
ders bevorzugt sind die Gattungen und Arten Rhodotorula rubra, 
Rhodotorula glutinis, Rhodotorula graminis, Yarrowia lipolytica, 
Sporobolomyces salmonicolor , Sporobolomyces shibatanus oder Sac- 

20 charomyces cerevisiae. 

Als Wirtsorganismus konnen prinzipiell alle Pflanzen verwendet 
werden, bevorzugt werden Pflanzen, die in der Tierernahrung oder 
in der humanen Ernahrung eine Rolle spielen wie Mais, Weizen, 
25 Gerste, Roggen, Kartoffeln, Erbsen, Bohnen, Sonnenblumen, Palmen, 
Hirse, Sesam, Kopra oder Raps. Auch Pflanzen wie Arabidopsis tha- 
liana oder Lavendula vera sind geeignet. Besonders bevorzugt wer- 
den pflanzliche Zellkulturen, Protoplasten aus Pflanzen oder Ka- 
luskulturen. 

30 

Vorteilhaf terweise werden im erf indungsgemaSen Verfahren Mikroor- 
ganismen wie Bakterien, Pilze, Hefen oder pflanzliche Zellen ver- 
wendet, die in der Lage sind Biotin in das Anzuchtsmedium auszu- 
scheiden und die gegebenenf alls zusatz.li.ch schon eine erhohte na- 

35 turliche Biotinsynthese haben. Vorteilhaf terweise konnen diese 
Organismen noch bezuglich der Regulation ihrer Biotinbiosynthese 
defekt sein, das heiSt es findet keine oder nur eine sehr verrin- 
gerte Regulation der Synthese statt. Dieser Regulationsdef ekt hat 
zur Folge, daS diese Organismen schon eine wesentlich hohere Bio- 

40 tinproduktivitat besitzen. Ein solcher Regulationsdef ekt ist bei- 

spielsweise von Escherichia coli als birA-Def ektmutanten bekannt 

und s o lit e~ vorz iugs^i" s¥~i^Form~e ines~dur ch^auSe r e-Ei-n f-liis s e-in^_ 
duzierbaren Defektes, beispielsweise temperaturinduzierbar, in 
den Zellen vorhanden sein. Es konnen im Prinzip auch Organismen 

45 verwendet werden, die keine natiirliche Biotinproduktion aufwei- 
sen, nachdem sie mit den Biotingenen transf ormiert wurden. 



15 
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Um die Biotinproduktivitat insgesamt weiter zu steigern sollten 
die Organismen im erf indungsgema&en Verfahren vorteilhaf terweise 
zusatzlich mindesten ein weiteres Biotingen ausgewahlt aus der 
Gruppe bioA, bioB, bioF f bioC, bioD, bioH, bioP, bioW, bioX, bioY 
5 Oder bioR enthalten. Vorteilhaf terweise konnen auch solcbe Gene 
in Kombination mit der Sequenz SEQ ID No. 1 , der SEQ ID NO: 3, 
der SEQ ID No. 5 oder der SEQ ID NO. 7 und ihrer Kombinationen in 
der Zelle vorhanden sein, die die Biotinsynthese stimulieren. 
Gene die die Biotinsynthese stimmulieren sind z. B. das Flavore- 
10 doxin-Gen, die Flavoredoxin-Reduktase-Gen. Dieses zusatzliche Gen 
oder diese zusatzlichen Gene konnen wie auch die Gene mit der Se- 
quenz SEQ ID No. 1 , der SEQ ID NO. 3, SEQ ID No. 5 oder der SEQ ID 
NO. 7 oder deren Kombinationen in ein oder mehreren Kopien in der 
Zelle vorhanden sein. Sie konnen auf dem gleichen Vektor wie die 
Sequenz SEQ ID No. 1, SEQ ID NO. 3, SEQ ID No. 5 und/oder SEQ ID 
No. 7 lokalisiert sein oder auf getrennten Vektoren oder aber 
chromosomal integriert worden sein. Auch die Sequenzen SEQ ID 
No. 1, SEQ ID No. 3, SEQ ID No. 5 und/oder SEQ ID No. 7 konnen zu- 
sammen auf einem Vektor oder auf getrennten Vektoren sein oder 
ins Genom inseriert werden. 

20 

Unter dem erf indungsgemafcen Genkonstrukt sind die Gensequenzen 
des SAM-Synthase-Gens SEQ ID No. 1 und der Biotinsynthegene SEQ 
ID No. 3, SEQ ID No. 5 und/oder SEQ ID No. 7, sowie deren funktio- 
nelle Varianten, Analoge oder Derivate zu verstehen, die mit ei- 
nem oder mehreren Regulationssignalen zur Erhohung der Genexpres- 
sion funktionell verkniipft wurden. Zusatzlich zu diesen neuen Re- 
gulationssequenzen kann die naturliche Regulation dieser Sequen- 
zen vor den eigent lichen Strukturgenen noch vorhanden sein und 
gegebenenf alls genetisch verandert worden sein, so da£ die natur- 
liche Regulation ausgeschaltet und die Expression der Gene erhoht 
wurde. Das Genkonstrukt kann aber auch einfacher aufgebaut sein, 
das heiSt es werden keine zusatzlichen Regulationssignale vor die 
Sequenzen SEQ ID No. 1, SEQ ID No. 3, SEQ ID No. 5 und/oder SEQ ID 
No. 7 inseriert und der naturliche Promotor mit seiner Regulation 
35 wird nicht entfernt. Stattdessen wird die naturliche Regulations- 
sequenz so mutiert, da£ keine Regulation durch Biotin mehr er- 
folgt und die Genexpression gesteigert wird. Die Sequenzen SEQ ID 
No. 1, SEQ ID No. 3, SEQ ID No . 5 und/oder SEQ ID No. 7 konnen unter 
der Regulation eines Promotors oder unter der Regulation getrenn- 
40 ter Promotoren liegen. Auch am 3'-Ende der DNA-Sequenzen konnen 
zusatzliche vorteilhafte regulatorische Elemente inseriert wer- 
den. Die Gene mit den Sequenzen SEQ ID No. 1, SEQ ID No. 3, SEQ 
ID No. 5 oder SEQ ID No. 7 konnen in einer oder mehreren Kopien im 
Genkonstrukt enthalten sein. 



25 



30 



45 



Vorteilhafte Regulationssequenzen fur das erf indungsgemafce Ver- 
fahren sind beispielsweise in Promotoren wie cos-, tac-, trp-, 
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tet-, trp-tet-, lpp-, lac-, lpp-lac-, lad*"- T7-, T5-, T3-, 
gal-, trc-, ara-, SP6-, X-Pr- oder im A.-P L - Promo tor enthalten, die 
vorteilhaf terweise in gram-negativen Bakterien Anwendung finden. 
Weitere vorteilhaf te Regulationssequenzen sind beispielsweise in 
5 den gram-posi tiven' Promotoren amy und SP02 # in den Hef epromotoren 
ADC1, MFa , AC, P-60, CYC1 , GAPDH oder in den Pf lanzenpromotoren 
CaMV/35S, SSU, OCS, lib4, usp, STLS1, B33, nos oder im Ubiquitin- 
oder Phaseolin-Promotor enthalten. 

10 Prinzipiell konnen alle natur lichen Promotoren mit ihren Regula- 
tionssequenzen wie die oben genannten fur das erf indungsgemafce 
Verfahren verwendet werden. Dariiberhinaus konnen auch syntheti- 
sche Promotoren vorteilhaf t verwendet werden. 

15 im Genkonstrukt konnen weitere Biotingene ausgewahlt aus der 

Gruppe bioA, bioB, bioF, bioC, bioD, bioH, bioP, bioW, bioX, bioY 
oder bioR in einer oder mehreren Kopien enthalten sein, die einen 
eigenen Promotor haben konnen oder aber unter der Regulation des 
Promotors einer der Sequenzen oder unter der Regulation des Pro- 

20 motors der gesamten Sequenzen SEQ ID No. 1, SEQ ID No. 3, SEQ ID 
No. 5 oder SEQ ID No. 7 liegen konnen. 

Das Genkonstrukt wird zur Expression in den oben genannten Wirts- 
organismus vorteilhaf terweise in einen wirtsspezif ischen Vektor 

25 inseriert, der eine optimale Expression der Gene im Wirt ermog- • 
licht. Vektoren sind dem Fachmann wohl bekannt und konnen bei- 
spielsweise aus dem Buch Cloning Vectors (Eds. Pouwels P. H. et 
al. Elsevier, Amsterdam-New York-Oxford, 1985, ISBN 0 444 904018) 
entnommen werden. Unter Vektoren sind aufcer Plasmiden auch alle 

30 anderen dem Fachmann bekannten Vektoren wie beispielsweise Pha- 
gen, Viren, Transposons, IS-Elemente, Phasmide, Cosmide, lineare 
oder zirkulare DNA zu verstehen. Diese Vektoren konnen autonom im 
Wirtsorganismus repliziert oder chromosomal repliziert werden. 

35 unter Express ions syst erne sind die Kombination aus den oben bei- 
spielhaft genannten Wirtsorganismen und den zu den Organismen 
passenden Vektoren wie Plasmide, Viren oder Phagen wie beispiels- 
weise Plasmide mit dem RNA— Polymerase /Promoter System, die Phagen 
3l, Mu oder andere temperante Phagen oder Transposons und/oder wei- 

40 teren vorteilhaf ten regulatorischen Sequenzen zu verstehen. 



Bevorzugt sind unter dem Begriff Expressionssysteme die Kombi~na^~~ 
tion aus Escherichia coli und seinen Plasmiden und Phagen und den 
dazugehorenden Promotoren sowie Bacillus und seine Plasmide und 
45 Promotoren zu verstehen. 
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Fiir die vorteilhafte erf indungsgemafce Expression der SEQ ID No.l, 
SEQ ID No. 3, SEQ ID No . 5 und/oder SEQ ID No. 7 sind aufierdem wei- 
tere 3' und/oder 5' Terminale regulator ische Seguenzen geeignet. 

5 Diese regulatorischen Sequenzen sollen die gezielte Expression 
der Biotingene und der Proteinexpression ermoglichen. Dies kann 
beispielsweise je nach wirtsorganismus bedeuten, da£ das Gen erst 
nach Induktion exprimiert oder iiberexprimiert wird, oder da£ es 
sofort exprimiert und/oder iiberexprimiert wird. 

10 

Die regulatorischen Seguenzen bzw. Faktoren konnen dabei vorzugs- 
weise die Biotingenexpression positiv beeinflussen und dadurch 
erhohen. So kann eine Verstarkung der regulatorischen Elemente 
vorteilhaf terweise auf der Transkriptionsebene erfolgen, indem 
15 starke Transkriptionssignale wie Promotoren und/oder "Enhancer" 
verwendet werden. Daneben ist aber auch eine Verstarkung der 
Translation mogiich, indem beispielsweise die Stabilitat der mRNA 
verbessert wird. 

20 

Unter "Enhancer" sind beispielsweise DNA-Sequenzen zu verstehen, 
die iiber eine verbesserte Wechselwirkung zwischen RNA- Polymerase 
und DNA eine erhohte Biotingenexpression bewirken. 

25 Eine Steigerung der von der Seguenz SEQ ID No. 1, SEQ ID No. 3, 
SEQ ID No. 5 und SEQ ID No. 7 abgeleiteten Proteinen (siehe SEQ ID 
No. 2, SEQ ID No. 4, SEQ ID No. 6 und SEQ ID No. 8) und ihrer Enzy- 
maktivitat lafit sich zum Beispiel gegeniiber den Ausgangsenzymen 
durch Veranderung der entsprechenden Genseguenzen oder der Se- 

30 quenzen seiner Homologen durch klassische Mutagenese wie UV-Be- 
strahlung oder Behandlung mit chemischen Mutagentien und/oder 
durch gezielte Mutagenese wie site directed mutagenesis, Dele- 
tion(en), Insertion(en) und/oder Substitution (en) erzielen. Auch 
kann eine erhohte Enzymaktivitat neben der beschriebenen Genam- 

35 plifikation durch Ausschaltung von Faktoren, die die Enzymbio- 
synthese reprimieren und/oder durch Synthese aktiver statt inak- 
tiver Enzyme erreicht werden. 

Durch das erf indungsgemafie Verfahren wird die Umwandlung von DTB 
40 in Biotin und damit die Biotinproduktivitat insgesamt iiber die in 
die Organismen iiber vektoren und/oder chromosomal klonierten ein- 
gebrachten Biotingene mit der Seguenz SEQ ID No. 1 ( der SEQ ID 
No. 3, SEQ ID No. 5 und der SEQ ID No . 7 und der Kombinationen der 
Gene der Sequenz SEQ ID No.l und der SEQ ID No. 5 oder SEQ ID No.l 
45 und der SEQ ID No. 1, bevorzugterweise die Kombination der Gene 
der Seguenz SEQ ID No.l und der SEQ ID No. 3 vorteilhaft gestei- 
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Im erf indungsgemaSen Verf ahren we r den die SEQ ID No.l, SEQ ID 
No. 3, SEQ ID No. 5 und/oder SEQ ID No. 7 enthaltenen Mikroorganis- 
5 men in einem Medium, das das Wachstum dieser Organismen ermog- 
licht, angezlichtet. Dieses Medium kann ein synthetisches oder ein 
natiirliches Medium sein. Je nach Organismus werden dem Fachmarm 
bekannte Medien verwendet. Fur das Wachstum der Mikroorganismen 
enthalten die verwendeten Medien eine Kohlenstoff quelle, eine 
10 Stickstof f quelle, anorganische Salze und gegebenenf alls geringe 
Mengen an Vitamine und Spurenelemente . 

Vorteilhafte Kohlenstoff quellen sind beispielsweise Zucker wie 
Mono-, Di- oder Polysaccharide wie Glucose, Fructose, Mannose, 

15 xylose, Galactose, Ribose, Sorbose, Ribulose, Lactose, Maltose, 
Saccharose, Raffinose, Starke oder Cellulose, komplexe Zucker- 
quellen wie Melasse, Zuckerphosphate wie Fructose-1 , 6-bisphosp- 
hat, Zuckeralkohole wie Mannit, Polyole wie Glycerin, Alkohole 
wie Methanol oder Ethanol , Carbonsauren wie Citronensaure, Milch- 

20 saure oder Essigsaure, Fette wie Sojaol oder Rapsol, Aminosauren 
wie Glutaminsaure oder Asparaginsaure oder Aminozucker, die auch 
gleichzeitig als Stickstof f quelle verwendet werden konnen. 

Vorteilhafte Stickstof fquellen sind organische oder anorganische 
25 stickstof fverbindungen oder Mater ialien, die diese Verbindungen 
enthalten. Beispiele sind Ammoniumsalze wie NH4CI oder (NH 4 )2S04* 
Nitrate, Harnstoff , oder komplexe Stickstof fquellen wie Maisquell- 
wasser, Bierhef eautolysat , Sojabohnenmehl, Weizengluten, Hefeex- 
trakt, Fleischextrakt, Caseinhydrolysat , Hefe oder Kartof f elpro- 
30 tein, die haufig auch gleichzeitig als Stickstof f quelle dienen 
konnen . 

Beispiele fur anorganische Salze sind die Salze von Calcium, Ma- 
gnesium, Natrium, Mangan, Kalium, Zink, Kupf er _und Eisen. Als An- 
35 ion dieser Salze sind besonders das Chlor-, Sulfat- und Phospha- 
tion zu nennen. Ein wichtiger Faktor zur Steigerung der Produkti- 
vitat im erf indungsgemafcen Verf ahren ist der Zusatz von Fe 2+ " oder 
Fe 3+ -Salzen und/oder Kaliumsalzen zum Produktionsmedium. 

40 Gegebenenf alls werden dem Nahrmedium weitere Wachs turns faktor en 

zugeset^,_wie ^^spi^^weise Vitamine oder Wachstumsf orderer wie 

Riboflavin , Thiamin , Folsaure, Nicotinsaure, Pantbthenat-oder-Py— 
ridoxin, Aminosauren wie Alanin, Cystein, Asparagin, Asparagin- 
saure, Glutamin, Serin, Methonin oder Lysin, Carbonsauren wie Ci- 
45 tronensaure, .Ameisensaure, Pimelinsaure oder Milchsaure, oder 
Substanzen wie Dithiothreitol . 
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Zur Stabilisierung der Vektoren mit den Biotingenen in den Zellen 
konnen gegebenenf alls Antibiotika dem Medium zugesetzt werden. 

Das Mischungsverhaltnis der genannten Nahrstoffe hangt von der 
5 Art der Fermentation ab und wird im Einzelfall festgelegt. Die 
Mediumkomponenten konnen alle zu Beginn der Fermentation vorge- 
legt werden, nachdem sie falls erforderlich getrennt sterilisiert 
Oder gemeinsam sterilisiert wurden, Oder aber je nach Bedarf wah- 
rend der Fermentation nachgegeben werden. 

10 

Die Zuchtungsbedingungen werden so festgelegt, daS die Organismen 
optimal wachsen und daS die bestmoglichen Ausbeuten erreicht wer- 
den. Bevorzugte Ziichtungs temper atur en liegen bei 15 °C bis 40 °C. 
Besonders vorteilhaft sind Temperaturen zwischen 25 °C und 37 °C. 

15 vorzugsweise wird der pH-Wert in einem Bereich von 3 bis 9 fest- 
gehalten. Besonders vorteilhaft sind pH-Werte zwischen 5 und 8. 
Im allgemeinen ist eine Inkubationsdauer von 8 bis 240 Stunden 
bevorzugt von 8 bis 12 0 Stunden ausreichend. Innerbalb diser Zeit 
reichert sich die maximale Menge an Biotin im Medium an und/oder 

20 ist nach AufschluS der Zellen verfiigbar. 

Das erf indungsgemafce Verfahren zur Herstellung von Biotin kann 
kontinuierlich oder batch- Oder f ed-batch-weise durchgefuhrt wer- 
den. VJerden aus den mit den Biotingenen trans formier ten Pflanzen- 
25 zellen ganze Pflanzen regeneriert, so konnen diese nach dem er- 
f indungsgemaSen Verfahren ganz normal angeziichtet und vermehrt 
werden . 

Beispiele: 

30 

1. Klonierung des S-Adenosyl-Methionin-Syntliase-Gens 
(SEQ ID No. 1) : 

35 Das Gen, das fur SAM-Synthase (metK) kodiert, wurde aus dem Chro- 
mosom von E. coli durch eine Polymerase-Kettenreaktion mit Hilfe 
zweier spezifischer Oligonukleotide ausgehend von genomischer E. 
coli DNA amplif iziert . Die derart amplif izierte DNA wurde aufge- 
reinigt, mit dem Restriktionsenzym Acc65I verdaut und in einen 

40 mit dem gleichen Enzym geschnittenen Vektor inseriert, der eine 
tJberexpression des Gens in E. coli Stammen ermoglicht. Durch ei- 
nes a er beiden Oligonukleotide wurde das Genkonstrukt mit oti- 
mierten Translationssignalen versehen 



a.) Entwicklung von Oligonukleot iden zur Amplif izierung des metK 
Gens aus dem E. coli Chromosom: 
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metK soil als Expressionskassette bestehend aus einer ribosomalen 
Bindungs telle, dem Startkodon der kodierenden Sequenz und dem 
Stopkodon zwischen zwei Erkennungs teller* fur Restriktionsenzyme 
amplif iziert werden. Fiir beide Restriktionsschnittstellen wurde 
5 die Erkennungssequenz von Acc65I gewahlt. Das metK Gen wurde mit 
Hilfe der Oligonucleotide PmetKl (5'- GCGGTACCAGGTGATATTAAATATG- 
GCAAAAC-3 ' ) und PmetK2 ( 5 ' — CGGGTACCGATTACTTCAGACCGGCAGC-3 ' ) am- 
plif iziert und kloniert. 



10 b. ) Durchfuhrung der PCR: 



Bedingungen: 



Als Matrize wurden 0,5 |ig chromosomale DNA von E. coli W3110 ver- 
15 wendet. Die Oligonukleotide PmetKl und PmetK2 wurden in einer 
Konzentration von je 15 pMol eingesetzt. Die Konzentration an 
dNTP's betrug 200 |IM. Als Polymerase wurden 2,5 U Pwo DNA-Polyme- 
rase (Boehringer Mannheim) im Reaktionspuf f er des Herstellers 
eingesetzt. Das Volumen der PCR-Reaktion betrug 100 . 

20 

Amplif ikationsbedingungen: 

Die Denaturierung der DNA erfolgte fur 2 min bei 94 °C. Anschlie- 
fcend wurden die Oligonukleotide fur 3 0 sec bei 55 °C angelagert. 
25 Die Elongation erfolgte fiir 75 sec bei 72 °C. Die PCR-Reaktion 
wurde liber 30 Zyklen durchgef uhrt . 



Das erhaltene DNA-Produkt mit einer GroSe von ca. 1145 bp wurde 
m aufgereinigt und durch Acc65l im geeigneten Puffer verdaut. 

c. ) Klonierung von metK in Expressionsvektor 

2 \xg des Vektors pHSl (Konstruktion wurde in DE 197.31274.8, 
Prioritat 22.7.97, Beispiele 1. Seite 14 bis 17 beschrieben) wur- 

* 5 den duch Acc65I verdaut und durch Shrimp Alkalische Phosphatase 
(SAP) (Boehringer Mannheim) dephosphoryliert . Nach Denaturierung 
der SAP wurden Vektor und Fragment in einem molaren Verhaltnis 
von 1:3 durch den Rapid-DNA-Ligation Kit nach der Vorschrift des 
Herstellers ligiert. Die Transformation des Ligationsansatzes er- 

10 fogte in den Stamm E. coli XL- 1 -blue. Positive Klone wurden durch 

Pl-asm-idprapa-rat-ion— und-Restriktionsanalyse__i^ 

richtige Orientierung des MetK-Fragments in pHSl wurde durch Re- 
striktionsverdau und Sequenzierung bestimmt. Das erhaltene Kon- 
strukt wurde pHSl metK (Figur 1) genannt. Die Sequenz von pHSl 

45 metK ist SEQ ID No. 9 zu entnehmen. SEQ ID No. 10 zeigt die abge- 
leitete Aminosauresequenz der codierenden Region fiir metK. 
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2. Konstruktion der Plasmide pHBbiol4 und pHSl bioSl 

Die Konstruktion der Plasmide pHBbiol4 und pHSl bioSl wurde be- 
reits beschrieben <DE 197.31274.8, Prioritat 22.7.97, Beispiele 
5 1, 2 und 5 ) . 

3. Konstruktion von pHSl metK bioSl 

Die Plasmide pHSl bioSl [SEQ ID No. 11, (DE 197.31274.8, Prioritat 

10 22.7.97), SEQ ID No. 12 zeigt die abgeleitete Aminosauresequenz 
der codierenden Region fur bioSl] und pHSl metK SEQ ID No. 9 wur- 
den durch einen Plasmid-Praparationsmethode (Boehringer) aufge- 
reinigt. Aus pHSl metK wurde das metK-Gen tragende Fragment durch 
einen Acc65l-Verdau isoliert. pHSl bioSl wurde durch Acc65I ver- 

15 daut, und durch Shrimp Alkalische Phosphatase (SAP) (Boehringer 
Mannheim) dephosphoryliert . Nach Denaturierung der SAP nach Vor- 
schrift des Herstellers wurden Vektor und das metK Fragment in 
einem molaren Verhaltnis von 1:3 durch den Rapid-DNA-Ligation Kit 
nach der Vorschrift des Herstellers ligiert. Die Transformation 

20 des Ligationsansatzes erfogte in den Stamm E. coli XL-l-blue. Po- 
sitive Klone wurden durch Plasmidpraparation und Restriktionsana- 
lyse identif iziert . Die richtige Orientierung des metK-Fragments 
in pHSl bioSl wurde durch Restriktionsverdau und Sequenzierung 
bestimmt. Das erhaltene Konstrukt wurde pHSl metK bioSl (Figur 2) 

25 genannt. Die Sequenz von pHSl metK bioSl ist SEQ ID No. 13 zu ent- 
nehmen. SEQ ID No. 14 zeigt die abgeleitete Aminosauresequenz der 
codierenden Region fur metK, SEQ ID No. 15 zeigt die abgeleitete 
Aminosauresequenz der codierenden Region fur bioSl 

30 4. Erhohung der Biotin-Produktivitat durch Uberexpression von 
metK, bioSl und metK in Kombination mit bioSl. 

Vom Stamm BM4086 (Ketner und Campbell J. Molec. Biology 1975 
96:13) wurde durch Plattieren auf Rif ampycin-Platten spontan-Ri- 

35 fampycin-resistente Kolonien isoliert. Von einem dieser resisten- 
ten Stamme wurde ein Pl-Lysat erzeugt. Mit diesem Pl-Lysat wurde 
der Stamm W3110 transduziert und anschliefcend Klone durch Rifam- 
pycin selektioniert . Der erhaltene Stamm mit dem Plasmid pHBbio!4 
nach der CaCl2~Methode transf ormiert (Maniatis et al. Molecular 

40 Cloning Cols Spring Harbour Laboratory Press 1989) und auf LB-Am- 
pizillin 100 [xg/ml angezogen. Der isolierte trnsf ormierte Stamm 
(LU5560) , wurde jeweils mit dem Plasmiden pHSl, pHSl metK, 
pHSl bioSl oder pHSl metK bioSl nach der CaCl2~Methode transf ormiert 
und auf LB-Agar mit Ampizillin 100 \ig/ml und Kanamyzin 25 |j.g/ml 

45 selektioniert- 
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j e eine Kolonie der jeweiligen Transf ormanden wurde in einer DYT- 
Kultur mit dem entsprechendem Antibiotika angeimpft und fur 12 h 
inkubiert. Die Ubernachtkultur {= UNK) wurde eingesetzt um eine 
10 ml Kultur in TB-Medium (Sambrook, J. Fritsch, E F. Maniatis, T. 
5 2nd ed. Cold Spring Harbor Laboratory Press., 1989 

ISBN 0-87969-373-8), das 30g/l Glycerol enthalt, mit den entspre- 
chenden Antibiotika anzuimpfen. Im Fall der Gegenwart der Plas- 
mide pHSl, pHSl metK, pHSlbioSl und pHSl metK bioSl erfolgte gleich- 
zeitig der Zusatz von ImM IPTG und 0,5% Arabinose zur Induktion 

10 der Genexpression von metK und bioSl bzw. der Kombination beider 
Gene. Nach 24h Stunden wurden die Zellen vom Kulturiiber stand 
durch Zentrifugation abgetrennt und die Biotin-Konzentration 
durch einen kompetitiven ELISA mit Streptavidin im Uberstand be- 
stimmt. Die Ergebnisse dieser Bestimmung sind Tabelle I zu ent- 

15 nehmen. 

Tabelle I: Bestimmung der Biotinkonzentration 
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Stamm 


Plasmid I 


Plasmid II 


Biotin mg/1 


LU5580 


pHBbiol4 


Kontrolle, ohne 
Plasmid 


11 


L.U5580 


pHBbiol4 


pHSl 


25 


LU5580 


pHBbiol4 


pHSl bioSl 


45 


LU5580 


pHBbiol4 


pHSl metK 


37 


LU5580 


pHBbiol4 


pHSl metK bioSl 


52 
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Patentansp ruche 

1. Verfahren zur Herstellung von Biotin, dadurch gekennzeichnet , 
5 da£ man ein S-Adenosyl-Methionin-Synthasegen rait der Sequenz 

SEQ ID No. 1 und mindestens ein weiteres Biotin-Biosynthese- 
gen bioSl, bioS2 Oder bioS3 mit den Sequenzen SEQ ID No. 3, 
SEQ ID No. 5 Oder SEQ ID No. 7 sowie ihre f unktionellen Va- 
rianten, Analoge oder Derivate in einem prokaryontischen oder 
10 eukaryontischen Wirtsorganismus , der in der Lage ist Biotin 

zu synthetisieren, exprimiert, diesen zuchtet und das synthe- 
tisierte Biotin direkt, nach Abtrennung der Biomasse oder 
nach Reinigung des Biotins verwendet. 

15 2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, da£ es 
sich bei den Varianten der Gene mit den Sequenzen SEQ ID 
No.l, SEQ ID No. 3, SEQ ID No . 5 und SEQ ID No. 7 um Gene 
handelt, die auf der von den Sequenzen nach Anspruch 1 abge- 
leiteten Aminosaureebene eine Homologie von 30 bis 100 % auf- 

20 weisen und eine gesteigerte Biotinsynthese ermoglichen . 

3. verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, da£ 
als Wirtsorganismus ein Organismus ausgewahlt aus der Gruppe 
der Gattungen Escherichia, citrobacter, Serratia, Klebsiella, 

25 Salmonella, Pseudomonas, Comamonas, Acinetobacter , Azotobac- 

ter, Chromobacterium, Bacillus, Chlostridium, Arthrobacter, 
Corynebacterium, Brevibacterium, Lactococcus , Lactobacillus , 
Streptomyces, Rhizobium, Agrobacterium, Staphylococcus, Rho- 
dotorula, Sprorobolomyces , Yarrowia, Schizosaccharomyces oder 

30 Saccharomyces verwendet wird. 

4. Verfahren nach den Anspruchen 1 bis 3, dadurch gekennzeich- 
net, da£ als Wirtsorganismus eine regulationsdef ekte Biotin- 
mutante verwendet wird. 

35 

5. Verfahren nach den Anspriichen 1 bis 4, dadurch gekennzeich- 
net, da& die Expression mindestens einer Kopie der Gene mit 
den Sequenzen SEQ ID No.l, SEQ ID No. 3, SEQ ID No. 5 und SEQ 
ID No. 7 nach Anspruch 1 allein oder mit einer oder mehreren 

40 Kopien mindestens eines weiteren Biotingens ausgewahlt aus 

der Gruppe bioA, bioB, bioF, bioC, bioD, bioH, bioP, bioW, 
bioX, bioY oder bioR in einem prokaryontischen oder eukaryon- 
tischen Wirtsorganismus erfolgt. 



45 



Zeichn. 
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6. Verfahren nach den Anspruchen 1 bis 5, dadurch gekennzeich- 
net; da£ die Expression mindestens einer Kopie der Gene mit 
den Sequenzen SEQ ID No.l, SEQ ID No. 3, SEQ ID No. 5 und SEQ 
ID No. 7 nach Anspruch 1 allein oder mit einer oder mehreren 

5 Kopien mindestens eines weiteren Biotingens ausgewahlt aus 

der Gruppe bioA, bioB, bioF, bioC, bioD, bioH, bioP, bioW, 
bioX, bioY oder bioR in einem prokaryontischen oder eukaryon- 
tischen Wirtsorganismus auf einem gemeinsamen oder auf ge- 
trennten Vektoren erfolgt. 

10 

7. Genkonstrukt enthaltend ein S-Adenosyl-Methionin-Synthasegen 
mit der SEQ ID No. 1 und mindestens ein weiteres Biotin-Bio- 
synthesegen bioSl, bioS2 oder bioS3 mit den Sequenzen SEQ ID 
No. 3, SEQ ID No. 5 und SEQ ID No. 7 sowie ihre f unktionellen 

15 Varianten, Analoge oder Derivate, das mit einem oder mehreren 

Regulationssignalen zur Erhohung der Genexpression und/oder 
Proteinexpression funktionell verknupft ist und/oder dessen 
natiirliche Regulation ausgeschaltet wurde. 

20 8. Genkonstrukt nach Anspruch 7, dadurch gekennzeichnet , da& es 
in einem Vektor inseriert wurde, der fur die Expression des 
Gens in einem prokaryontischen oder eukaryontischen Wirtsor- 
ganismus geeignet ist. 

25 9. Genkonstukt nach Anspruch 7 oder 8, dadurch gekennzeichnet, 
da£ die Gene mit den Sequenzen SEQ ID No. 1, SEQ ID No. 3, 
SEQ ID No. 5 und SEQ ID No . 7 sowie ihre f unktionellen Va- 
rianten, Analoge oder Derivate in mehreren Kopien im Genkon- 
strukt vorliegen. 

30 

10. Genkonstrukt nach Anspruchen 7 bis 9, dadurch gekennzeichnet, 
daS das S-Adenosyl-Methionin-Synthasegen SEQ ID No. 1 und 
mindestens ein weiteres Biotin-Biosynthesegen bioSl, bioS2 
oder bioS3 mit den Sequenzen SEQ ID No. .3., SEQ. ID No. 5 und 
35 SEQ ID No. 7 sowie ihre f unktionellen Varianten, Analoge oder 

Derivate nach Anspruch 7 zusammen mit einer oder mehreren Ko- 
pien mindestens eines weiteren Gens ausgewahlt aus der Gruppe 
bioA, bioB, bioF, bioC, bioD, bioH, bioP, bioW, bioX, bioY 
oder bioR im Genkonstrukt oder Vektor vorliegt. 

40 

11. _ Qrg anismen en th altend ein Genkonstrukt gemaE den Anspruchen 7 

bis 10. — — — 



12 . Verwendung der Sequenzen gemaS Anspruch 1 zur Herstellung von 
45 Biotin. 
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13. Verwendung des bioS3-Gens mit der Sequenz SEQ ID No. 7 seiner 
funktionellen Varianten, Analoge oder Derivate allein oder in 
Kombination mit mindestens einem weiteren Gen ausgewahlt aus 
der Gruppe S-Adenosyl-Methionin-Synthasegen, bioSl, bioS2 , 

5 bioA, bioB, bioF, bioC, bioD, bioH, bioP, bioW, bioX, bioY 

oder bioR zur Herstellung von Biotin. 

14. Verwendung eines Genkonstrukts gemafi den Anspruchen 7 bis 10 
zur Herstellung von Biotin. 

10 
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FIG.1 
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1 Aat II 
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428 Aocl 
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1687 Acc651 
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Sac I1 1990 
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1715 Sma I 
1715 Xma I 
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FIG.2 



Bgl II 4870 
Bel 1 4865 
Eag 1 4800 
Drdl4679 
Bal 1 4626 



1 Aat II 



Sph 
Nael' 
Rsrll4190 
iSac 1 4020 
Sac 1 4020 
Spe I 3908 
Xba 1 3838 
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Ase I 3819 J 
Sfu I 3732= 
BstB I 3732- 
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662 SnaB I 
705 PfiM I 




881 BstE II 



Avrll 3105 



1405 Pvu 
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1747 Xma I 
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SEQUENZPROTOKOLL 

<110> BASF Aktiengesellschaf t 

<120> Verfahren zur Herstellung von Biotin 

<130> 0050_48792 

<140> 19806872.7 
<141> 1998-02-19 



<160> 15 



<170> Patentln Vers. 2.0 



<210> 1 
<211> 1155 
<212> DNA 

<213> Escherichia coli 



<220> 

<221> CDS 

<222> (1) . . (1155) 



<400> 1 

atg gca aaa cac ctt ttt acg tec gag tec gtc tct gaa ggg cat cct 

Met Ala Lys His Leu Phe Thr Ser Glu Ser Val Ser Glu Gly His Pro 

1 5 10 15 

gac aaa att get gac caa att tct gat gec gtt tta gac gcg ate etc 
Asp Lys He Ala Asp Gin He Ser Asp Ala Val Leu Asp Ala He Leu 
20 25 30 

gaa cag gat ccg aaa gca cgc gtt get tgc gaa acc tac gta aaa ace 
Glu Gin Asp Pro Lys Ala Arg Val Ala Cys Glu Thr Tyr Val Lys Thr 
35 40 45 

ggc atg gtt tta gtt ggc ggc gaa ate acc acc age gee tgg gta gac 
Gly Met Val Leu Val Gly Gly Glu He Thr Thr Ser Ala Trp Val Asp 
50 55 60 

ate gaa gag ate acc cgt aac acc gtt cgc gaa att ggc tat gtg cat 
He Glu Glu He Thr Arg Asn Thr Val Arg Glu He Gly Tyr Val His 
65 70 75 80 



48 



96 



144 



192 



240 



tec gac atg ggc ttt gac get aac tec tgt gcg gtt ctg age get ate 
Ser Asp Met Gly Phe Asp Ala Asn Ser Cys Ala Val Leu Ser Ala He 

85 90 95 



288 



ggc aaa cag tct cct gac ate aac cag ggc gtt gac cgt gee gat ccg 
Gly Lys Gin Ser Pro Asp He Asn Gin Gly Val Asp Arg Ala Asp Pro 



&LANK 
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110 



ctg gaa cag ggc gcg ggt gac cag ggt ctg atg ttt ggc tac gca act 384 
Leu Glu Gin Gly Ala Gly Asp Gin Gly Leu Met Phe Gly Tyr Ala Thr 
115 120 125 

aat gaa acc gac gtg ctg atg cca gca cct ate acc tat gca cac cgt 
Asn Glu Thr Asp Val Leu Met Pro Ala Pro lie Thr Tyr Ala His Arg 
130 135 140 

ctg gta cag cgt cag get gaa gtg cgt aaa aac ggc act ctg ccg tgg 
Leu Val Gin Arg Gin Ala Glu Val Arg Lys Asn Gly Thr Leu Pro Trp 
145 150 155 160 

ctg cgc ccg gac gcg aaa age cag gtg act ttt cag tat gac gac ggc 528 
Leu Arg Pro Asp Ala Lys Ser Gin Val Thr Phe Gin Tyr Asp Asp Gly 
165 170 175 



aaa ate gtt ggt ate gat get gtc gtg ctt tec act cag cac tct gaa 
Lys He Val Gly He Asp Ala Val Val Leu Ser Thr Gin His Ser Glu 
180 185 190 

gag ate gac cag aaa teg ctg caa gaa gcg gta atg gaa gag ate ate 
Glu He Asp Gin Lys Ser Leu Gin Glu Ala Val Met Glu Glu He He 
195 200 205 

'.-.•» - -* 

aag cca att ctg ccc get gaa tgg ctg act tct gec acc aaa ttc ttc 
Lys Pro He Leu Pro Ala Glu Trp Leu Thr Ser Ala Thr Lys Phe Phe 
210 215 220 

ate aac ccg acc ggt cgt ttc gtt ate ggt ggc cca atg ggt gac tgc 
He Asn Pro Thr Gly Arg Phe Val He Gly Gly Pro Met Gly Asp Cys 
225 230 235 240 

ggt ctg act ggt cgt aaa att ate gtt gat acc tac ggc ggc atg gcg 
Gly Leu Thr Gly Arg Lys He He Val Asp Thr Tyr Gly Gly Met Ala 
245 250 255 

cgt cac ggt ggc ggt gca ttc tct ggt aaa gat cca tea aaa gtg gac 
Arg His Gly Gly Gly Ala Phe Ser Gly Lys Asp Pro Ser Lys Val Asp 
260 265 270 

cgt tec gca gee tac gca gca cgt tat gtc gcg aaa aac ate gtt get 
_Arg Ser Ala Ala Tyr Ala Ala Arg Tyr Val Ala Lys Asn He Val Ala 
275 280 285 



get ggc ctg gec gat cgt tgt gaa att cag gtt tec tac gca ate ggc 
Ala Gly Leu Ala Asp Arg Cys Glu He Gin Val Ser Tyr Ala He Gly 
290 295 300 

gtg get gaa ccg acc tec ate atg gta gaa act ttc ggt act gag aaa 



432 



480 



576 



624 



672 



720 



768 



816 



864 



912 



960 
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Val Ala Glu Pro Thr Ser He Met Val Glu Thr Phe Gly Thr Glu Lys 
305 310 315 320 



gtg cct tct gaa caa ctg acc ctg ctg gta cgt gag ttc ttc gac ctg 
Val Pro Ser Glu Gin Leu Thr Leu Leu Val Arg Glu Phe Phe Asp Leu 
325 330 335 

cgc cca tac ggt ctg att cag atg ctg gat ctg ctg cac ccg ate tac 
Arg Pro Tyr Gly Leu He Gin Met Leu Asp Leu Leu His Pro He Tyr 
340 345 350 

aaa gaa acc gca gca tac ggt cac ttt ggt cgt gaa cat ttc ccg tgg 
Lys Glu Thr Ala Ala Tyr Gly His Phe Gly Arg Glu His Phe Pro Trp 
355 360 365 

gaa aaa acc gac aaa gcg cag ctg ctg cgc gat get gec ggt ctg aag 
Glu Lys Thr Asp Lys Ala Gin Leu Leu Arg Asp Ala Ala Gly Leu Lys 
370 375 380 

taa 
385 



1008 



1056 



1104 



1152 



1155 



<210> 2 
<211> 384 
<212> PRT 

<213> Escherichia cbli 
<400> 2 

Met Ala Lys His Leu 
1 5 

Asp Lys He Ala Asp Gin He Ser Asp Ala Val Leu Asp Ala He Leu 
20 25 30 

Glu Gin Asp Pro Lys Ala Arg Val Ala Cys Glu Thr Tyr Val Lys Thr 
35 40 45 

Gly Met Val Leu Val Gly Gly Glu He Thr Thr Ser Ala Trp Val Asp 
50 55 60 

He Glu Glu He Thr Arg Asn Thr Val Arg Glu He Gly Tyr Val His 
65 70 75 80 



Ser Asp Met Gly Phe Asp Ala Asn Ser Cys Ala Val Leu Ser Ala He 

85 90 95 



Phe Thr Ser Glu Ser Val Ser Glu Gly His Pro 

10 15 



Gly Lys Gin Ser Pro Asp He Asn Gin Gly Val Asp Arg Ala Asp Pro 
100 105 HO 



1 
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Leu Glu Gin Gly Ala Gly Asp Gin Gly Leu Met Phe Gly Tyr Ala Thr 
115 120 125 

Asn Glu Thr Asp Val Leu Met Pro Ala Pro He Thr Tyr Ala His Arg 
130 135 140 

Leu Val Gin Arg Gin Ala Glu Val Arg Lys Asn Gly Thr Leu Pro Trp 
145 150 155 160 

Leu Arg Pro Asp Ala Lys Ser Gin Val Thr Phe Gin Tyr Asp Asp Gly 
165 170 175 

Lys He Val Gly He Asp Ala Val Val Leu Ser Thr Gin His Ser Glu 
180 185 190 

Glu He Asp Gin Lys Ser Leu Gin Glu Ala Val Met Glu Glu lie He 
195 200 205 

Lys Pro He Leu Pro Ala Glu Trp Leu Thr Ser Ala Thr Lys Phe Phe 
210 215 220 

He Asn Pro Thr Gly Arg Phe Val He Gly Gly Pro Met Gly Asp Cys 
225 230 235 240 

Gly Leu Thr Gly Arg Lys He He Val Asp Thr Tyr Gly Gly Met Ala 
245 250 255 

Arg His Gly Gly Gly Ala Phe Ser- Gly Lys Asp Pro Ser Lys Val Asp 
260 ' 265 270 

Arg Ser Ala Ala Tyr Ala Ala Arg Tyr Val Ala Lys Asn He Val Ala 
275 280 285 

Ala Gly Leu Ala Asp Arg Cys Glu He Gin Val Ser Tyr Ala He Gly 
290 295 300 

Val Ala Glu Pro Thr Ser He Met Val Glu Thr Phe Gly Thr Glu Lys 
305 310 315 320 

Val Pro Ser Glu Gin Leu Thr Leu Leu Val Arg Glu Phe Phe Asp Leu 
325 330 335 

Arg Pro Tyr Gly Leu He Gin Met Leu Asp Leu Leu His Pro He Tyr 
340 345 350 



Lys Glu Thr Ala Ala Tyr Gly His Phe Gly Arg Glu His Phe Pro Trp 
355 360 365 



Glu Lys Thr Asp Lys Ala Gin Leu Leu Arg Asp Ala Ala Gly Leu Lys 
370 375 380 
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<210> 3 
<211> 1206 
<212> DNA 

<213> Escherichia coli 



<220> 

<221> CDS 

<222> (1) . . (1206) 



<400> 3 

atg aac gtt ttt aat ccc gcg cag ttt cgc gcc cag ttt ccc gca eta 

Met Asn Val Phe Asn Pro Ala Gin Phe Arg Ala Gin Phe Pro Ala Leu 

15 10 15 

cag gat gcg ggc gtc tat etc gac age gcc gcg acc gcg ctt aaa cct 

Gin Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro 

20 25 30 

gaa gcc gtg gtt gaa gcc acc caa cag ttt tac agt ctg age gcc gga 

Glu Ala Val Val Glu Ala Thr Gin Gin Phe Tyr Ser Leu Ser Ala Gly 

35 40 45 



48 



96 



144 



aac gtc cat cgc age cag ttt gcc gaa gcc caa cgc ctg acc gcg cgt 192 
Asn Val His Arg Ser Gin Phe Ala Glu Ala Gin Arg Leu Thr Ala Arg 
50 55 60 

tat gaa get gca cga gag aaa gtg gcg caa tta ctg aat gca ccg gat 240 
Tyr Glu Ala Ala Arg Glu Lys Val Ala Gin Leu Leu Asn Ala Pro Asp 
65 70 75 80 

gat aaa act ate gtc tgg acg -6gc ggc* acc act gaa tec ate aac atg 
Asp Lys Thr lie Val Trp Thr Arg Gly Thr Thr Glu Ser lie Asn Met 

85 90 95 

gtg gca caa tgc tat gcg cgt ccg cgt ctg caa ccg ggc gat gag att 
Val Ala Gin Cys Tyr Ala Arg Pro Arg Leu Gin Pro Gly Asp Glu lie 
100 105 HO 

att gtc age gtg gca gaa cac cac gcc aac etc gtc ccc tgg ctg atg 
He Val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met 
115 120 125 

gtc gcc caa caa act gga gcc aaa gtg gtg aaa ttg ccg ctt aat gcg 432 

~Val — Ala'HGTirm 

130 135 140 



288 



336 



384 



cag cga ctg ccg gat gtc gat ttg ttg cca gaa ctg att act ccc cgt 
Gin Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu He Thr Pro Arg 
145 150 155 160 
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agt egg att ctg gcg ttg ggt cag atg teg aac gtt act ggc ggt tgc 

Ser Arg lie Leu Ala Leu Gly Gin Met Ser Asn Val Thr Gly Gly Cys 
165 170 175 



528 



ccg gat ctg gcg cga gcg att acc ttt get cat tea gee ggg atg gtg 576 
Pro Asp Leu Ala Arg Ala He Thr Phe Ala His Ser Ala Gly Met Val 
180 185 190 

gtg atg gtt gat ggt get cag ggg gca gtg cat ttc ccc gcg gat gtt 
Val Met Val Asp Gly Ala Gin Gly Ala Val His Phe Pro Ala Asp Val 
195 200 205 

cag caa ctg gat att gat ttc tat get ttt tea ggt cac aaa ctg tat 
Gin Gin Leu Asp He Asp Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr 
210 215 220 

ggc ccg aca ggt ate ggc gtg ctg tat ggt aaa tea gaa ctg ctg gag 
Gly Pro Thr Gly He Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu 
225 230 235 240 

gcg atg teg ccc tgg ctg ggc ggc ggc aaa atg gtt cac gaa gtg agt 
Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser 
245 250 255 

ttt gac ggc ttc acg act caa tct gcg ccg tgg aaa ctg gaa get gga 
Phe Asp Gly Phe Thr Thr Gin Ser Ala Pro Trp Lys Leu Glu Ala Gly 
260 - . 265 270 

acg cca aat gtc get ggt gtc ata gga tta age gcg gcg ctg gaa tgg 
Thr Pro Asn Val Ala Gly Val He Gly Leu Ser Ala Ala Leu Glu Trp 
275 280 285 

ctg gca gat tac gat ate aac cag gec gaa age tgg age cgt age tta 
Leu Ala Asp Tyr Asp He Asn Gin Ala Glu Ser Trp Ser Arg Ser Leu 
290 295 300 

gca acg ctg gcg gaa gat gcg ctg gcg aaa cgt ccc ggc ttt cgt tea 960 
Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser 
305 310 315 320 



ttc cgc tgc cag gat tec age ctg ctg gee ttt gat ttt get ggc gtt 
Phe Arg Cys Gin Asp Ser Ser Leu Leu Ala Phe Asp Phe Ala Gly Val 
325 330 335 



624 



672 



720 



768 



816 



864 



912 



cat cat age gat atg gtg acg ctg ctg gcg^gag^tac~ggt -att-gec-ctg- 
His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly He Ala Leu 
340 345 350 



1008 



1056 



egg gec ggg cag cat tgc get cag ccg eta ctg gca gaa tta ggc gta 
Arg Ala Gly Gin His Cys Ala Gin Pro Leu Leu Ala Glu Leu Gly Val 
355 .360 365 



1104 
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acc ggc aca ctg cgc gcc 
Thr Gly Thr Leu Arg Ala 
370 

gtg gat gcg ctg gtg aat 
Val Asp Ala Leu Val Asn 
385 390 

gat taa 
Asp 



tct ttt gcg cca tat aat 
Ser Phe Ala Fro Tyr Asn 
375 380 

gcc gtt gac cgc gcg ctg 
Ala Val Asp Arg Ala Leu 
395 



aca aag agt gat 1152 
Thr Lys Ser Asp 

gaa tta ttg gtg 1200 
Glu Leu Leu Val 
400 

1206 



<210> 4 
<211> 401 
<212> PRT 

<213> Escherichia coli 
<400> 4 

Met Asn Val Phe Asn Pro Ala Gin Phe Arg Ala Gin Phe Pro Ala Leu 
15 10 15 

Gin Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro 
20 25 30 

Glu Ala Val Val Glu Ala Thr Gin Gin Phe Tyr Ser Leu Ser Ala Gly 
35 40 45 

Asn Val His Arg Ser Gin Phe Ala Glu Ala Gin Arg Leu Thr Ala Arg 
50 /' * 55 60 

Tyr Glu Ala Ala Arg Glu Lys Val Ala Gin Leu Leu Asn Ala Pro Asp 
65 70 75 80 

Asp Lys Thr lie Val Trp Thr Arg Gly Thr Thr Glu Ser lie Asn Met 

85 90 95 

Val Ala Gin Cys Tyr Ala Arg Pro Arg Leu Gin Pro Gly Asp Glu lie 
100 105 HO 

lie Val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met 
115 120 125 

Val Ala Gin Gin Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala 



130 135 140- 



Gln Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu lie Thr Pro Arg 
145 150 155 160 



Ser Arg He Leu Ala Leu Gly Gin Met Ser Asn Val Thr Gly Gly Cys 
165 170 175 
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Pro Asp Leu Ala Arg Ala He Thr Phe Ala His Ser Ala Gly Met Val 
180 185 190 

Val Met Val Asp Gly Ala Gin Gly Ala Val His Phe Pro Ala Asp Val 
195 200 205 

Gin Gin Leu Asp He Asp Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr 
210 215 220 

Gly Pro Thr Gly He Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu 
225 230 235 240 

Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser 
245 250 255 

Phe Asp Gly Phe Thr Thr Gin Ser Ala Pro Trp Lys Leu Glu Ala Gly 
260 265 270 

Thr Pro Asn Val Ala Gly Val He Gly Leu Ser Ala Ala Leu Glu Trp 
275 280 285 

Leu Ala Asp Tyr Asp He Asn Gin Ala Glu Ser Trp Ser Arg Ser Leu 
290 295 300 

Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser 
305 310 315 320 

Phe Arg Cys Gin Asp Ser Ser Leu Leu Ala Phe Asp Phe Ala Gly Val 
325 330 335 

> s ■■ 'i . 

His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly He Ala Leu 
340 345 350 

Arg Ala Gly Gin His Cys Ala Gin Pro Leu Leu Ala Glu Leu Gly Val 
355 360 365 

Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp 
370 375 380 

Val Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu Leu Leu Val 
385 390 395 400 

As p 



<210> 5 
<211> 1215 
<212> DNA 

<213> Escherichia coli 
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<220> 

<221> CDS 

<222> (1) . . (1215) 

<400> 5 

atg aaa tta ccg att tat etc gac tac tec gca acc acg ccg gtg gac 

Met Lys Leu Pro lie Tyr Leu Asp Tyr Ser Ala Thr Thr Pro Val Asp 

15 10 15 

ccg cgt gtt gec gag aaa atg atg cag ttt atg acg atg gac gga acc 
Pro Arg Val Ala Glu Lys Met Met Gin Phe Met Thr Met Asp Gly Thr 
20 25 30 

ttt ggt aac ccg gec tec cgt tct cac cgt ttc ggc tgg cag get gaa 
Phe Gly Asn Pro Ala Ser Arg Ser His Arg Phe Gly Trp Gin Ala Glu 
35 40 45 

gaa gcg gta gat ate gec cgt aat cag att gee gat ctg gtc ggc get 
Glu Ala Val Asp lie Ala Arg Asn Gin lie Ala Asp Leu Val Gly Ala 
50 55 60 

gat ccg cgt gaa ate gtc ttt acc tct ggt gca acc gaa tct gac aac 
Asp Pro Arg Glu lie Val Phe Thr Ser Gly Ala Thr Glu Ser Asp Asn 
65 70 75 80 

ctg gcg ate aaa ggt gca gec aac ttt tat cag aaa aaa ggc aag cac 
Leu Ala lie Lys Gly Ala Ala Asn Phe Tyr Gin Lys Lys Gly Lys His 

85 90 95 



aac ggc att ate gac ctg aaa gaa ctt gaa gca gcg atg cgt gac gac 
Asn Gly lie lie Asp Leu Lys Glu Leu Glu Ala Ala Met Arg Asp Asp 
130 135 140 

acc ate etc gtg tec ate atg cac gta aat aac gaa ate ggc gtg gtg 
Thr lie Leu Val Ser lie Met His Val Asn Asn Glu lie Gly Val Val 
145 150 155 160 



48 



96 



144 



192 



240 



288 



ate ate acc age aaa acc gaa cac aaa gcg gta ctg gat acc tgc cgt 33 6 
lie lie Thr Ser Lys Thr Glu His Lys Ala Val Leu Asp Thr Cys Arg 
100 105 HO 

cag ctg gag cgc gaa ggt ttt gaa gtc acc tac ctg gca ccg cag cgt 3 84 
Gin Leu Glu Arg Glu Gly Phe Glu Val Thr Tyr Leu Ala Pro Gin Arg 
115 120 125 



cag gat ate gcg get ate ggc gaa atg tgc cgt get cgt ggc att ate 
Gin Asp lie Ala Ala He Gly Glu Met Cys Arg Ala Arg Gly He He 
165 170 175 

tat cac gtt gat gca acc cag age gtg ggt aaa ctg cct ate gac ctg 
Tyr His Val Asp Ala Thr Gin Ser Val Gly Lys Leu Pro He Asp Leu 



432 



480 



528 



576 
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185 



PCT/EP99/01052 

190 



age cag ttg aaa gtt gac ctg atg tct tec tec ggt cac aaa ate tat 624 
Ser Gin Leu Lys Val Asp Leu Met Ser Phe Ser Gly His Lys lie Tyr 
195 200 205 

ggc ccg aaa ggt ate ggt gcg ctg tat gta cgt cgt aaa ccg cgc gta 672 
Gly Pro Lys Gly lie Gly Ala Leu Tyr Val Arg Arg Lys Pro Arg Val 
210 215 220 

cgc ate gaa gcg caa atg cac ggc ggc ggt cac gag cgc ggt atg cgt 72 0 
Arg lie Glu Ala Gin Met His Gly Gly Gly His Glu Arg Gly Met Arg 
225 230 235 240 

tec ggc act ctg cct gtt cac cag ate gtc gga atg ggc gag gee tat 768 
Ser Gly Thr Leu Pro Val His Gin lie Val Gly Met Gly Glu Ala Tyr 
245 250 255 

cgc ate gca aaa gaa gag atg gcg ace gag atg gaa cgt ctg cgc ggc 816 
Arg lie Ala Lys Glu Glu Met Ala Thr Glu Met Glu Arg Leu Arg Gly 
260 265 270 

ctg cgt aac'cgt ctg tgg aac ggc ate aaa gat ate gaa gaa gtt tac 864 
laeu Arg Asn Arg Leu Trp Asn Gly lie Lys Asp lie Glu Glu Val Tyr 
275 280 285 

ctg aac ggt gac ctg gaa cac ggt gcg ccg aac att etc aac gtc age 912 
Leu Asn Gly Asp Leu Glu His Gly Ala Pro Asn lie Leu Asn Val Ser 
290 295 300 

ttc aac tac gtt gaa ggt gag teg ctg att atg gcg ctg aaa gac etc 960 
Phe Asn Tyr Val Glu Gly Glu Ser Leu lie Met Ala Leu Lys Asp Leu 
305 310 315 320 

gca gtt tct tea ggt tec gee tgt acg tea gca age etc gaa ccg tec 1008 
Ala Val Ser Ser Gly Ser Ala Cys Thr Ser Ala Ser Leu Glu Pro Ser 
325 330 335 

tac gtg ctg cgc gcg ctg ggg ctg aac gac gag ctg gca cat age tct 1056 
Tyr Val Leu Arg Ala Leu Gly Leu Asn Asp Glu Leu Ala His Ser Ser 
340 345 350 



ate cgt ttc tct tta ggt cgt ttt act act gaa gaa gag ate gac tac 
lie Arg Phe Ser Leu Gly Arg Phe Thr Thr Glu Glu Glu lie Asp Tyr 
3 55 3~60 365 



1104 



acc ate gag tta gtt cgt aaa tec ate ggt cgt ctg cgt gac ctt tct 1152 
Thr lie Glu Leu Val Arg Lys Ser lie Gly Arg Leu Arg Asp Leu Ser 
370 375 380 



ccg ctg tgg gaa atg tac aag cag ggc gtg gat ctg aac age ate gaa 



1200 
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Pro Leu Trp Glu Met Tyr Lys Gin Gly Val Asp Leu Asn Ser lie Glu 

385 390 395 400 

tgg get cat cat taa 1215 
Trp Ala His His 

405 



<210> 6 
<211> 404 
<212> PRT 

<213> Escherichia coli 
<400> 6 

Met Lys Leu Pro lie Tyr Leu Asp Tyr Ser Ala Thr Thr Pro Val Asp 
15 10 15 

Pro Arg Val Ala Glu Lys Met Met Gin Phe Met Thr Met Asp Gly Thr 
20 25 30 

Phe Gly Asn Pro Ala Ser Arg Ser His Arg Phe Gly Trp Gin Ala Glu 
35 40 45 

Glu Ala Val Asp lie Ala Arg Asn Gin lie Ala Asp Leu Val Gly Ala 
50 - 55 ' 60 

Asp Pro Arg Glu lie Val Phe Thr Ser Gly Ala Thr Glu Ser Asp Asn 
65 70 75 80 

Leu Ala lie Lys Gly Ala Ala Asn Phe Tyr Gin Lys Lys Gly Lys His 

85 90 95 

lie lie Thr Ser Lys Thr Glu His Lys Ala Val Leu Asp Thr Cys Arg 
100 105 HO 

Gin Leu Glu Arg Glu Gly Phe Glu Val Thr Tyr Leu Ala Pro Gin Arg 
115 120 125 

Asn Gly lie lie Asp Leu Lys Glu Leu Glu Ala Ala Met Arg Asp Asp 
130 135 140 

Thr lie Leu Val Ser lie Met His Val Asn Asn Glu lie Gly Val Val 
145 150 155 160 



Gin Asp He Ala Ala Ile~ Gly Glu Met Cys Arg Ala~~Arg Gly lie ~rie- 
165 170 175 

Tyr His Val Asp Ala Thr Gin Ser Val Gly Lys Leu Pro He Asp Leu 

180 185 190 



Ser Gin Leu Lys Val Asp Leu Met Ser Phe Ser Gly His Lys He Tyr 
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Gly Pro Lys Gly lie Gly Ala Leu Tyr Val Arg Arg Lys Pro Arg Val 
210 215 220 

Arg He Glu Ala Gin Met His Gly Gly Gly His Glu Arg Gly Met Arg 
225 230 235 240 

Ser Gly Thr Leu Pro Val His Gin He Val Gly Met Gly Glu Ala Tyr 
245 250 255 

Arg He Ala Lys Glu Glu Met Ala Thr Glu Met Glu Arg Leu Arg Gly 
260 265 270 

Leu Arg Asn Arg Leu Trp Asn Gly He Lys Asp He Glu Glu Val Tyr 
275 280 285 

Leu Asn Gly Asp Leu Glu His Gly Ala Pro Asn He Leu Asn Val Ser 
290 295 300 

Phe Asn Tyr Val Glu Gly Glu Ser Leu He Met Ala Leu Lys Asp Leu 
305 310 315 320 

Ala Val Ser Ser Gly Ser Ala Cys Thr Ser Ala Ser Leu Glu Pro Ser 
325 330 335 

Tyr Val Leu Arg Ala Leu Gly Leu Asn Asp Glu Leu Ala His Ser Ser 
340 345 350 

He Arg Phe Ser Leu Gly Arg Phe Thr Thr Glu Glu Glu He Asp Tyr 
355 360 365 

Thr He Glu Leu Val Arg Lys Ser He Gly Arg Leu Arg Asp Leu Ser 
370 375 380 

Pro Leu Trp Glu Met Tyr Lys Gin Gly Val Asp Leu Asn Ser He Glu 
385 390 395 400 

Trp Ala His His 



<210> 7 
<211> 1221 

<21_2> DNA _ 

< 2.1.3 > Escherichia coli 

<220> 

<221> CDS 

<222> (1) . . (1221) 



<400> 7 
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atg att ttt tec gtc gac aaa-gtg egg gec gac ttt ccg gtg ctt teg 

Met lie Phe Ser Val Asp Lys Val Arg Ala Asp Phe Pro Val Leu Ser 

5 10 15 



1 



cgt gag gta aac ggt ttg ccg ctg get tat etc gac age gee gec agt 
Arg Glu Val Asn Gly Leu Pro Leu Ala Tyr Leu Asp Ser Ala Ala Ser 
20 25 30 



cat ggc tac gcg gcg gtg cat cgt ggt att cat ace tta age gec cag 

His Gly Tyr Ala Ala Val His Arg Gly lie His Thr Leu Ser Ala Gin 

50 55 60 

gcg acc gag aaa atg gag aac gtg cgc aag egg gca teg ctg ttt att 

Ala Thr Glu Lys Met Glu Asn Val Arg Lys Arg Ala Ser Leu Phe lie 

65 70 75 80 

aat gee cgt teg gcg gaa gag ctg gtg ttc gtc cgc ggc acg acg gaa 

Asn Ala Arg Ser Ala Glu Glu Leu Val Phe Val Arg Gly Thr Thr Glu 

85 90 95 



cat ggc gca aaa gtg ctg gtg gat ggc get cag gcg gtg atg car cat 
His Gly Ala Lys Val Leu Val Asp Gly Ala Gin Ala Val Met His His 
195 200 205 



48 



96 



gcg cag aaa ccg age cag gtg att gac gee gag gee gag ttt tat cgt 144 
Ala Gin Lys Pro Ser Gin Val He Asp Ala Glu Ala Glu Phe Tyr Arg 
35 40 45 



192 



240 



288 



ggg ate aat ctg gte gec aat age tgg ggc aac age aac gtg egg gcg 336 
Gly He Asn Leu Val Ala Asn Ser Trp Gly Asn Ser Asn Val Arg Ala 
100 105 HO 

ggc gat aac ate ate ate agt cag atg gag cac cac get aac att gtt 3 84 
Gly Asp Asn He He He Ser Gin Met Glu His His Ala Asn lie Val 
115 " r 120 125 

ccc tgg cag atg ctt tgc gca cgc gtt ggc gca gag ctg cgt gtg ate 
Pro Trp Gin Met Leu Cys Ala Axg Val Gly Ala Glu Leu Arg Val lie 
130 135 140 

ccg etc aat ccc gat ggt acg ttg caa ctg gag acg ctg cct acg ctg 
Pro Leu Asn Pro Asp Gly Thr Leu Gin Leu Glu Thr Leu Pro Thr Leu 
145 150 155 160 

ttt gat gag aaa act cgc ctg ctg gca att act cat gtc tec aac gtg 
Phe Asp Glu Lys Thr Arg Leu Leu Ala He Thr His Val Ser Asn Val 
165 170 175 

ctt ggc aca gaa" aat cca ~ct of gcg g^aT^"^^tc^acg~ctt~gcg--cac-cag 576- 
Leu Gly Thr Glu Asn Pro Leu Ala Glu Met He Thr Leu Ala His Gin 
180 185 190 
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480 



528 
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ccg gtg gat gtt cag gcg ctg gat tgc gac ttt tac gtg ttc tec ggg 672 
Pro Val Asp Val Gin Ala Leu Asp Cys Asp Phe Tyr Val Phe Ser Gly 
210 215 220 

cat aaa ctg tat ggc ccc acc gga att ggc att ctt tat gtg aaa gaa 72 0 
His Lys Leu Tyr Gly Pro Thr Gly lie Gly lie Leu Tyr Val Lys Glu 
225 230 235 240 

gec ttg ttg cag gag atg ccg ccg tgg gaa ggg ggc ggt tct atg ate 768 
Ala Leu Leu Gin Glu Met Pro Pro Trp Glu Gly Gly Gly Ser Met lie 
245 250 255 

gec acc gtc age ctg agt gaa ggc act acc tgg acc aaa gca cca tgg 816 
Ala Thr Val Ser Leu Ser Glu Gly Thr Thr Trp Thr Lys Ala Pro Trp 
260 265 270 

egg ttt gaa gec ggt aca ccc aat acc ggg ggc ate att ggt ctt ggc 
Arg Phe Glu Ala Gly Thr Pro Asn Thr Gly Gly lie lie Gly Leu Gly 
275 280 285 

gcg gcg ctg gag tat gtt teg gcg ctg ggg ctt aat aac ata gee gag 
Ala Ala Leu Glu Tyr Val Ser Ala Leu Gly Leu Asn Asn lie Ala Glu 
290 295 300 

tat gaa cag aat ctg atg cat tat gcg eta tea cag ctg gaa tct gta 
Tyr Glu Gin Asn Leu Met His Tyr Ala Leu Ser Gin Leu Glu Ser Val 
305 310 315 320 

ccg gat etc act etc tat ggc cca caa aac agg ctt ggc gtt att get 1008 
Pro Asp Leu Thr Leu Tyr Gly Pro Gin Asn Arg Leu Gly Val lie Ala 
325 330 335 

ttt aat etc ggt aaa cac cac gee tat gat gtt ggc agt ttt etc gat 1056 
Phe Asn Leu Gly Lys His His Ala Tyr Asp Val Gly Ser Phe Leu Asp 
340 345 350 



aat tac ggc att get gtg cgt acc gga cat cac tgc gca atg cca ttg 
Asn Tyr Gly lie Ala Val Arg Thr Gly His His Cys Ala Met Pro Leu 
355 360 365 



864 



912 



960 



1104 



atg gee tat tac aac gtc cct gcg atg tgt egg gcg teg ctg gec atg 1152 
Met Ala Tyr Tyr Asn Val Pro Ala Met Cys Arg Ala Ser Leu Ala Met 
370 375 380 



tat aac acc cat gaa gaa gtg gat cgt ctg gtg acc ggc ctg caa cgt 1200 
Tyr Asn Thr His Glu Glu Val Asp Arg Leu Val Thr Gly Leu Gin Arg 
385 390 395 400 



att cac cgt ttg ctg gga taa 
lie His Arg Leu Leu Gly 



1221 
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<210> 8 
<211> 406 
<212> PRT 

<213> Escherichia coli 



<400> 8 

Met lie Phe Ser Val Asp Lys Val Arg Ala Asp Phe Pro Val Leu Ser 
15 10 15 

Arg Glu Val Asn Gly Leu Pro Leu Ala Tyr Leu Asp Ser Ala Ala Ser 
20 25 30 

Ala Gin Lys Pro Ser Gin Val He Asp Ala Glu Ala Glu Phe Tyr Arg 
35 40 45 

His Gly Tyr Ala Ala Val His Arg Gly lie His Thr Leu Ser Ala Gin 
50 55 60 

Ala Thr Glu Lys Met Glu Asn Val Arg Lys Arg Ala Ser Leu Phe He 
65 70 75 80 

Asn Ala Arg Ser Ala Glu Glu Leu Val Phe Val Arg Gly Thr Thr Glu 

85 90 95 

Gly He Asn Leu Val Ala Asn Ser Trp Gly Asn'' Ser Asn Val Arg Ala 
100 105 HO 

Gly Asp Asn He He He Ser Gin Met Glu His His Ala Asn He Val 
115 120 125 

Pro Trp Gin Met Leu Cys Ala Arg Val Gly Ala Glu Leu Arg Val He 
130 135 140 

Pro Leu Asn Pro Asp Gly Thr Leu Gin Leu Glu Thr Leu Pro Thr Leu 
145 150 155 160 

Phe Asp Glu Lys Thr Arg Leu Leu Ala lie Thr His Val Ser Asn Val 
165 170 175 

Leu Gly Thr Glu Asn Pro Leu Ala Glu Met He Thr Leu Ala His Gin 
180 185 190 



His Gly Ala Lys Val Leu Val Asp Gly Ala Gin Ala Val Met His His 
195 200 205 



Pro Val Asp Val Gin Ala Leu Asp Cys Asp Phe Tyr Val Phe Ser Gly 
210 215 220 
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His Lys Leu Tyr Gly Pro Thr Gly lie Gly lie Leu Tyr Val Lys Glu 

225 230 235 240 

Ala Leu Leu Gin Glu Met Pro Pro Trp Glu Gly Gly Gly Ser Met lie 
245 250 255 

Ala Thr Val Ser Leu Ser Glu Gly Thr Thr Trp Thr Lys Ala Pro Trp 
260 265 270 

Arg Phe Glu Ala Gly Thr Pro Asn Thr Gly Gly lie lie Gly Leu Gly 
275 280 285 

Ala Ala Leu Glu Tyr Val Ser Ala Leu Gly Leu Asn Asn lie Ala Glu 
290 . 295 300 

Tyr Glu Gin Asn Leu Met His Tyr Ala Leu Ser Gin Leu Glu Ser Val 
305 310 315 320 

Pro Asp Leu Thr Leu Tyr Gly Pro Gin Asn Arg Leu Gly Val lie Ala 
325 330 335 

Phe Asn Leu Gly Lys His His Ala Tyr Asp Val Gly Ser Phe Leu Asp 
340 345 350 

Asn Tyr Gly lie Ala Val Arg Thr Gly His His Cys Ala Met Pro Leu 
355 360 365 

Met Ala Tyr Tyr Asn Val Pro Ala Met Cys Arg Ala Ser Leu Ala Met 
370 375 380 

Tyr Asn Thr His Glu Glu Val Asp Arg Leu Val Thr Gly Leu Gin Arg 
385 390 395 400 

lie His Arg Leu Leu Gly 
405 



<210> 9 
<211> 3720 
<212> DNA 

<213> Escherichia coli 

<220> 
<221> CDS 



<222> (530) . . (1684) 



<400> 9 

gacgtctgtg tggaattgtg agcggataac aatttcacac agggccctcg gacaccgagg 60 
agaatgtcaa gaggcgaaca cacaacgtct tggagcgcca gaggaggaac gagctaaaac 12 0 
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ggagcttttt tgccctgcgt gaccagatcc cggagttgga aaacaatgaa aaggccccca 180 

aggtagttac ccttaaaaaa gccacagcat acatcctgtc cgtccaagca gaggagcaaa 240 

agctcatttc tgaagaggac ttgttgcgga aacgacgaga acagttgaaa cacaaacttg 3 00 

aacagctacg gaactcttgt gcgtaaggaa aagtaaggaa aacgattcct tctaacagaa 360 

atgtcctgag caatcaccta tgaactgtcg actcgagata gcatttttat ccataagatt 42 0 

agccgatcct aaggtttaca attgtgagcg ctcacaatta tgatagattc aattgtgagc 480 

ggataacaat ttcacacacg ctagcggtac caaagaggag aaattaact atg gca aaa 53 8 

Met Ala Lys 
1 



cac ctt ttt acg tec gag tec gtc tct gaa ggg cat cct gac aaa att 
His Leu Phe Thr Ser Glu Ser Val Ser Glu Gly His Pro Asp Lys lie 
5 10 15 



ccg aaa gca cgc gtt get tgc gaa acc tac gta aaa acc ggc atg gtt 
Pro Lys Ala Arg Val Ala Cys Glu Thr Tyr Val Lys Thr Gly Met Val 

40 45 50 



586 



get gac caa att tct gat gec gtt tta gac gcg ate etc gaa cag gat 63 4 
Ala Asp Gin lie Ser Asp Ala Val Leu Asp Ala He Leu Glu Gin Asp 
20 25 30 35 



682 



tta gtt ggc ggc gaa ate acc acc age gee tgg gta gac ate gaa gag 73 0 
Leu Val Gly Gly Glu He Thr Thr Ser Ala Trp Val Asp He Glu Glu 
55 60 65 

ate acc cgt aac acc gtt cgc gaa att ggc tat gtg cat tec gac atg 77 8 
He Thr Arg Asn Thr Val Arg Glu He Gly Tyr Val His Ser Asp Met 
70 75 80 

ggc ttt gac get aac tec tgt gcg gtt ctg age get ate ggc aaa cag 82 6 
Gly Phe Asp Ala Asn Ser Cys Ala Val Leu Ser Ala He Gly Lys Gin 
85 90 95 

tct cct gac ate aac cag ggc gtt gac cgt gec gat ccg ctg gaa cag 
Ser Pro Asp lie Asn Gin Gly Val Asp Arg Ala Asp Pro Leu Glu Gin 
100 105 HO H5 

ggc~ "gcg "ggt ~gac ~cag~ ggt ~ct" g""at'g~ttt~ ggc— tac-gca— ac-t— aa-t-gaa-acc 922. 

Gly Ala Gly Asp Gin Gly Leu Met Phe Gly Tyr Ala Thr Asn Glu Thr 
120 ■ 125 • 130 



874 



gac gtg ctg atg 
Asp Val Leu Met 
135 



cca gca cct ate acc tat gca cac cgt ctg gta cag 
Pro Ala Pro He Thr Tyr Ala His Arg Leu Val Gin 
140 145 



970 
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cgt cag get gaa gtg cgt aaa aac ggc act ctg ccg tgg ctg cgc ccg 

Arg Gin Ala Glu Val Arg Lys Asn Gly Thr Leu Pro Trp Leu Arg Pro 
150 155 160 

gac gcg aaa age cag gtg act ttt cag tat gac gac ggc aaa ate gtt 

Asp Ala Lys Ser Gin Val Thr Phe Gin Tyr Asp Asp Gly Lys He Val 
165 170 175 



cag aaa teg ctg caa gaa gcg gta atg gaa gag ate ate aag cca att 
Gin Lys Ser Leu Gin Glu Ala Val Met Glu Glu He He Lys Pro He 
200 205 210 

ctg ccc get gaa tgg ctg act tct gec acc aaa ttc ttc ate aac ccg 
Leu Pro Ala Glu Trp Leu Thr Ser Ala Thr Lys Phe Phe He Asn Pro 
215 220 225 

acc ggt cgt ttc gtt ate ggt ggc cca atg ggt gac tgc ggt ctg act 
Thr Gly Arg Phe Val He Gly Gly Pro Met Gly Asp Cys Gly Leu Thr 
230 235 240 

ggt cgt aaa att ate gtt gat acc tac ggc ggc atg gcg cgt cac ggt 
Gly Arg Lys He He Val Asp Thr Tyr Gly Gly Met Ala Arg His Gly 
245 250 255 



gec tac gca gca cgt tat gtc gcg aaa aac ate gtt get get ggc ctg 

Ala Tyr Ala Ala Arg Tyr Val Ala Lys Asn He Val Ala Ala Gly Leu 

280 285 290 

gee gat cgt tgt gaa att cag gtt tec tac gca ate ggc gtg get gaa 

Ala Asp Arg Cys Glu He Gin Val Ser Tyr Ala He Gly Val Ala Glu 

295 300 305 

ccg acc tec ate atg gta gaa act ttc ggt act gag aaa gtg cct tct 
Pro Thr Ser He Met Val Glu Thr Phe Gly Thr Glu Lys Val Pro Ser 

310 315 320 



gaa caa ctg acc ctg ctg gta cgt gag ttc ttc gac ctg cgc cca tac 
Glu Gin Leu Thr Leu Leu Val Arg Glu Phe Phe Asp Leu Arg Pro Tyr 
325 330 335 

ggt ctg att cag atg ctg gat ctg ctg cac ccg ate tac aaa gaa acc 
Gly Leu He Gin Met Leu Asp Leu Leu His Pro He Tyr Lys Glu Thr 



1018 



1066 



ggt ate gat get gtc gtg ctt tec act cag cac tct gaa gag ate gac 1114 
Gly He Asp Ala Val Val Leu Ser Thr Gin His Ser Glu Glu He Asp 
180 185 190 195 



1162 



1210 



1258 



1306 



ggc ggt gca ttc tct ggt aaa gat cca tea aaa gtg gac cgt tec gca 1354 
Gly Gly Ala Phe Ser Gly Lys Asp Pro Ser Lys Val Asp Arg Ser Ala 
260 265 270 275 



1402 



1450 



1498 



1546 



1594 
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340 



345 



350 



355 



gca gca tac ggc cac ttt ggt cgt gaa cat ttc ccg tgg gaa aaa acc 
Ala Ala Tyr Gly His Phe Gly Arg Glu His Phe Pro Trp Glu Lys Thr 
360 365 370 



1642 ' 



gac aaa gcg cag ctg ctg cgc gat get gec ggt ctg aag taa 
Asp Lys Ala Gin Leu Leu Arg Asp Ala Ala Gly Leu Lys 

375 380 385 



1684 



tcggtaccgc ttgatatcga attcctgeag ccegggggat cccatggtac gcgtgctaga 1744 
ggcatcaaat aaaacgaaag gctcagtcga aagactgggc ctttcgtttt atctgttgtt 1804 
tgtcggtgaa cgctctcctg agtaggacaa atccgccgcc ctagacctag gggatatatt 1864 
ccgcttcctc gctcactgac tcgctacgct eggtegtteg actgeggega gcggaaatgg 1924 
cttacgaacg gggeggagat ttcctggaag atgccaggaa gacactcaac agggaagtga 1984 
gagggecgeg geaaagcegt ttttccatag gctccgcccc cctgacaagc atcacgaaat 2044 
ctgacgctca aatcagtggt ggcgaaaccc gacaggacta taaagatacc aggegtttec 2104 
ccctggcggc tccctcgtgc gctctcctgt tcctgccttt cggtttaccg gtgtcattcc 2164 
gctgttatgg ccgcgtttgt ctcattccac gcctgacact cagttccggg taggcagttc 2224 
gctccaagct ggactgtatg cacgaacccc ccgttcagtc cgaccgctgc gccttatccg 22 84 
gtaactatcg tcttgagtcc aacceggaaa gaeatgeaaa agcaccactg gcagcagcca 23 44 
ctggtaattg atttagagga gttagtcttg aagtcatgcg ccggttaagg ctaaactgaa 2404 
aggacaagtt ttggtgactg cgctcctcca agecagttae ctcggttcaa agagttggta 2 464 
gctcagagaa ccttcgaaaa accgccctgc aaggcggttt tttcgttttc agagcaagag 2 524 
attacgegea gaccaaaacg atctcaagaa gatcatctta ttaatcagat aaaatatttc 2584 
tagatttcag tgcaatttat ctcttcaaat gtagcacctg aagtcagccc catacgatat 2 644 
aagttgttac tagtgcttgg attctcacca ataaaaaacg cccggcggca accgagegtt 2704 
ctfgaa^aaft^c^^ 

gagctctcga accccagagt cccgctcaga agaactegtc aagaaggega tagaaggega 2 824 
tgegctgega ategggageg gcgataccgt aaagcacgag gaageggtea gcccattcgc 2 884 
cgccaagctc ttcagcaata teaegggtag ccaacgctat gtcctgatag cggtccgcca 2944 
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cacccagccg 


gccacagtcg 


atgaatccag 


aaaagcggcc 


attttccacc 


atgatattcg 


3004 


gcaagcaggc 


atcgccatgg 


gtcacgacga . 


gatcctcgcc 


gtcgggcatg 


cgcgccttga 


3064 


gcctggcgaa 


cagttcggct 


ggcgcgagcc 


cctgatgctc 


ttcgtccaga 


tcatcctgat 


3124 


cgacaagacc 


ggcttccatc 


cgagtacgtg 


ctcgctcgat 


gcgatgtttc 


gcttggtggt 


3184 


cgaatgggca 


ggtagccgga 


tcaagcgtat 


gcagccgccg 


cattgcatca 


gccatgatgg 


3244 


atactttctc 


ggcaggagca 


aggtgagatg 


acaggagatc 


ctgccccggc 


acttcgccca 


3304 


atagcagcca 


gtcccttccc 


gcttcagtga 


caacgtcgag 


cacagctgcg 


caaggaacgc 


3364 


ccgtcgtggc 


cagccacgat 


agccgcgctg 


cctcgtcctg 


cagttcattc 


agggcaccgg 


3424 


acaggtcggt 


cttgacaaaa 


agaaccgggc 


gcccctgcgc 


tgacagccgg 


aacacggcgg 


3484 


catcagagca 


gccgattgtc 


tgttgtgccc 


agtcatagcc 


gaatagcctc 


tccacccaag 


3544 


cggccggaga 


acctgcgtgc 


aatccatctt 


gttcaatcat 


gcgaaacgat 


cctcatcctg 


3604 


tctcttgatc 


agatcttgat 


cccctgcgcc 


atcagatcct 


tggcggcaag 


aaagccatcc 


3664 


agtttacttt 


gcagggcttc 


ccaaccttac 


cagagggcgc 


cccagctggc 


aattcc 


3720 



<210> 10 
<211> 384 
<212> PRT 

<213> Escherichia coli 
<400> 10 

Met Ala Lys His Leu Phe Thr Ser Glu Ser Val Ser Glu Gly His Pro 
15 10 15 

Asp Lys He Ala Asp Gin He Ser Asp Ala Val Leu Asp Ala He Leu 
20 25 30 

Glu Gin Asp. Pro Lys Ala Arg Val Ala Cys Glu Thr Tyr Val Lys Thr 
35 40 45 

Gly Met Val Leu Val Gly Gly Glu He Thr Thr Ser Ala Trp Val Asp 

"50 ~ — 5"5 60 

He Glu Glu He Thr Arg Asn Thr Val Arg Glu He Gly Tyr Val His 
65 70 75 80 

Ser Asp Met Gly Phe Asp Ala Asn Ser Cys Ala Val Leu Ser Ala He 

85 90 95 
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Gly Lys Gin Ser 
100 

Leu Glu Gin Gly 
115 

Asn Glu Thr Asp 
130 

Leu Val Gin Arg 
145 

Leu Arg Pro Asp 



Lys lie Val Gly 
180 



Pro Asp lie Asn 



Ala Gly Asp Gin 
120 

Val Leu Met Pro 
135 

Gin Ala Glu Val 
150 

Ala Lys Ser Gin 
165 

lie Asp Ala Val 



Gin Gly Val Asp 
105 

Gly Leu Met Phe 



Ala Pro lie Thr 
140 

Arg Lys Asn Gly 
155 

Val Thr Phe Gin 
170 

Val Leu Ser Thr 
185 



Arg Ala Asp Pro 

1 1 A 

Gly Tyr Ala Thr 
125 

Tyr Ala His Arg 



Thr Leu Pro Trp 
160 

Tyr Asp Asp Gly 
175 

Gin His Ser Glu 
190 



Glu He Asp Gin Lys Ser Leu Gin Glu Ala Val Met Glu Glu He He 
195 200 205 

Lys Pro He Leu Pro Ala Glu Trp Leu Thr Ser Ala Thr Lys Phe Phe 
210 215 220 



He Asn Pro Thr Gly Arg Phe Val He Gly Gly Pro Met Gly Asp Cys 
225 230 235 240 

Gly Leu Thr Gly Arg Lys He He Val Asp Thr Tyr Gly Gly Met Ala 
245 250 255 

»i. 

Arg His Gly Gly Gly Ala Phe Ser Gly Lys Asp Pro Ser Lys Val Asp 
260 265 270 

Arg Ser Ala Ala Tyr Ala Ala Arg Tyr Val Ala Lys Asn He Val Ala 
275 280 285 

Ala Gly Leu Ala Asp Arg Cys Glu He Gin Val Ser Tyr Ala He Gly 
290 295 300 

Val Ala Glu Pro Thr Ser lie Met Val Glu Thr Phe Gly Thr Glu Lys 
305 310 315 320 

Val Pro Ser Glu Gin Leu Thr Leu Leu Val Arg Glu Phe Phe Asp Leu 

325 330 3-3-5— 

Arg Pro Tyr Gly Leu He Gin Met Leu Asp Leu Leu His Pro lie Tyr 
340 345 350 

Lys Glu Thr Ala Ala Tyr Gly His Phe Gly Arg Glu His Phe Pro Trp 
355 360 365 
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Glu Lys Thr Asp Lys Ala Gin Leu Leu Arg Asp Ala Ala Gly Leu Lys 
370 375 380 



<210> 11 
<211> 3794 
<212> DNA 

<213> Escherichia coli 

<220> 
<221> CDS 

<222> (601) . . (1806) 
<400> 11 

gacgtctgtg tggaattgtg agcggataac aatttcacac agggccctcg gacaccgagg 60 

agaatgtcaa gaggcgaaca cacaacgtct tggagcgcca gaggaggaac gagctaaaac 12 0 

ggagcttttt tgccctgcgt gaccagatcc cggagttgga aaacaatgaa aaggccccca 180 

aggtagttat ccttaaaaaa gccacagcat acatcctgtc cgtccaagca gaggagcaaa 240 

agctcatttc tgaagaggac ttgttgcgga aacgacgaga acagttgaaa cacaaacttg 300 

aacagctacg gaactcttgt gcgtaaggaa aagtaaggaa aacgattcct tctaacagaa 3 60 

atgtcctgag caatcaccta tgaactgtcg ;actcgagata gcatttttat ccataagatt 420 

agccgatcct aaggtttaca attgtgagcg ctcacaatta tgatagattc aattgtgagc 480 

ggataacaat ttcacacacg ctagcggtac cgggcccccc ctcgaggtcg acggtatcga 540 

taagcttgat atcgaattcc tgcagcccgg gggatcccat ggtacgcgtc gaggagtacc 600 

atg aac gtt ttt aat ccc gcg cag ttt cgc gcc cag ttt ccc gca eta 648 
Met Asn Val Phe Asn Pro Ala Gin Phe Arg Ala Gin Phe Pro Ala Leu 
15 10 15 

cag gat gcg ggc gtc tat etc gac age gcc gcg acc gcg ctt aaa cct 696 
Gin Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro 
20 25 30 

gaa gcc gtg gtt gaa gcc acc caa cag ttt tac agt ctg age gcc gga 744 

"~ i GilT~Al^~VaI~Vare 

35 40 45 



aac gtc cat cgc age cag ttt gcc gaa gcc caa cgc ctg acc gcg cgt 792 
Asn Val His Arg Ser Gin Phe Ala Glu Ala Gin Arg Leu Thr Ala Arg 
50 55 60 
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tat gaa get gca cga gag aaa gtg gcg caa tta ctg aat gca ccg gat 840 

Tyr Glu Ala Ala Arg Glu Lys Val Ala Gin Leu Leu Asn Ala Pro Asp 
65 70 75 80 

gat aaa act ate gtc tgg acg cgc ggc acc act gaa tec ate aac atg 
Asp Lys Thr He Val Trp Thr Arg Gly Thr Thr Glu Ser He Asn Met 

85 90 95 

gtg gca caa tgc tat gcg cgt ccg cgt ctg caa ccg ggc gat gag att 
Val Ala Gin Cys Tyr Ala Arg Pro Arg Leu Gin Pro Gly Asp Glu He 
100 105 HO 

att gtc age gtg gca gaa cac cac gec aac etc gtc ccc tgg ctg atg 
He Val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met 
115 120 125 

gtc gec caa caa act gga gec aaa gtg gtg aaa ttg ccg ctt aat gcg 
Val Ala Gin Gin Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala 
130 135 140 

cag cga ctg ccg gat gtc gat ttg ttg cca gaa ctg att act ccc cgt 
Gin Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu He Thr Pro Arg 
145 150 155 160 

agt egg att ctg gcg ttg ggt cag atg teg aac gtt act ggc ggt tgc 
Ser Arg lie Leu Ala Leu Gly Gin Met Ser Asn Val Thr Gly Gly Cys 
165 170 175 



888 



936 



984 



1032 



1080 



1128 



ccg gat ctg gcg cga gcg att acc ttt get cat tea gec ggg atg gtg 117 6 

Pro Asp Leu Ala Arg Ala He Thr Phe Ala His Ser Ala Gly Met Val 

180 185 190 

gtg atg gtt gat ggt get cag ggg gca gtg cat ttc ccc gcg gat gtt 1224 

Val Met Val Asp Gly Ala Gin Gly Ala Val His Phe Pro Ala Asp Val 
195 200 205 



1272 



1320 



cag caa ctg gat att gat ttc tat get ttt tea ggt cac aaa ctg tat 
Gin Gin Leu Asp lie Asp Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr 
210 215 220 

ggc ccg aca ggt ate ggc gtg ctg tat ggt aaa tea gaa ctg ctg gag 
Gly Pro Thr Gly lie Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu 
225 230 235 240 

~gcg~atg~ tcg~ccc" ~^g^t^^~m^W3'^ '^^^^'^^c^^^^^- 9 ^^- 1368 

Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser 
245 250 255 



ttt gac ggc ttc acg act caa tct gcg ccg tgg aaa ctg gaa get gga 
Phe Asp Gly Phe Thr Thr Gin Ser Ala Pro Trp Lys Leu Glu Ala Gly 
260 265 270 



1416 



1 
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acg cca aat gtc get ggt gtc ata gga tta age gcg gcg ctg gaa tgg 
Thr Pro Asn Val Ala Giy val He Gly Leu Ser Ala Ala Leu Glu Trp 
275 280 285 



1464 



1608 



1656 



ctg gca gat tac gat ate aac cag gee gaa age tgg age cgt age tta 1512 
Leu Ala Asp Tyr Asp He Asn Gin Ala Glu Ser Trp Ser Arg Ser Leu 
290 295 300 

gca acg ctg gcg gaa gat gcg ctg gcg aaa cgt ccc ggc ttt cgt tea 1560 
Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser 
305 310 315 320 

ttc cgc tgc cag gat tec age ctg ctg gec ttt gat ttt get ggc gtt 
Phe Arg Cys Gin Asp Ser Ser Leu Leu Ala Phe Asp Phe Ala Gly Val 
325 330 335 

cat cat age gat atg gtg acg ctg ctg gcg gag tac ggt att gec ctg 
His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Giy He Ala Leu 
340 345 350 

egg gee ggg cag cat tgc get cag ccg eta ctg gca gaa tta ggc gta 17 04 
Arg Ala Gly Gin His Cys Ala Gin Pro Leu Leu Ala Glu Leu Gly Val 
355 360 365 

acc ggc aca ctg cgc gee tct ttt gcg cca tat aat aca aag agt gat 1752 
Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp 
370 375 380 

gtg gat gcg ctg gtg aat gee gtt gac cgc gcg ctg gaa tta ttg gtg 1800 
Val Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu Leu Leu Val 
385 390 395 400 

gat taa aegegtgeta gaggcatcaa ataaaacgaa aggctcagtc gaaagactgg 185 6 
Asp 

gectttegtt ttatctgttg tttgtcggtg aacgctctcc tgagtaggac aaatccgccg 1916 
ccctagacct aggggatata ttccgcttcc tcgctcactg actcgctacg cteggtegtt 1976 
cgactgcggc gageggaaat ggcttacgaa eggggeggag atttcctgga agatgecagg 2036 
aagatactta acagggaagt gagagggecg cggcaaagcc gtttttccat aggctccgcc 2096 
~~ T-cclTtgac^^c^^a^g^a^a^^^ -21.56_. 
tataaagata ccaggcgttt ccccctggcg gctccctcgt gcgctctcct gttcctgcct 2216 
ttcggtttac cggtgtcatt ccgctgttat ggccgcgttt gtctcattcc acgcctgaca 227 6 
ctcagttccg ggtaggcagt tcgctccaag ctggactgta tgcacgaacc ccccgttcag 2336 
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tccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccgga aagacatgca 23 96 
aaagcaccac tggcagcagc cactggtaat tgatttagag gagttagtct tgaagtcatg 2456 
cgccggttaa ggctaaactg aaaggacaag ttttggtgac tgcgctcctc caagccagtt 2516 
acctcggttc aaagagttgg tagctcagag aaccttcgaa aaaccgccct gcaaggcggt 2576 
tttttcgttt tcagagcaag agattacgcg cagaccaaaa cgatctcaag aagatcatct 2636 
tattaatcag ataaaatatt tctagatttc agtgcaattt atctcttcaa atgtagcacc 2696 
tgaagtcagc cccatacgat ataagttgtt actagtgctt ggattctcac caataaaaaa 27 56 
cgcccggcgg caaccgagcg ttctgaacaa atccagatgg agttctgagg tcattactgg 2 816 
atctatcaac aggagtccaa gcgagctctc gaaccccaga gtcccgctca gaagaactcg 2876 
tcaagaaggc gatagaaggc gatgcgctgc gaatcgggag cggcgatacc gtaaagcacg 29 3 6 
aggaagcggt cagcccattc gccgccaagc tcttcagcaa tatcacgggt agccaacgct 2 9 96 
atgtcctgat agcggtccgc cacacccagc cggccacagt cgatgaatcc agaaaagcgg 3056 
ccattttcca ccatgatatt cggcaagcag gcatcgccat gggtcacgac gagatcctcg 3116 
ccgtcgggca tgcgcgcctt gagcctggcg aacagttcgg ctggcgcgag cccctgatgc 317 6 
tcttcgtcca gatcatcctg atcgacaaga ccggcttcca tccgagtacg tgctcgctcg 32 3 6 
atgcgatgtt tcgcttggtg gtcgaatggg -caggtagccg gatcaagcgt atgcagccgc 3296 
cgcattgcat cagccatgat ggatactttc tcggcaggag caaggtgaga tgacaggaga 3356 
tcctgccccg gcacttcgcc caatagcagc cagtcccttc ccgcttcagt gacaacgtcg 3416 
agcacagctg cgcaaggaac gcccgtcgtg gccagccacg atagccgcgc tgcctcgtcc 347 6 
tgcagttcat tcagggcacc ggacaggtcg gtcttgacaa aaagaaccgg gcgcccctgc 353 6 
gctgacagcc ggaacacggc ggcatcagag cagccgattg tctgttgtgc ccagtcatag 3 5 96 
ccgaatagcc cctccaccca agcggccgga gaacctgcgt gcaatccatc ttgttcaatc 3656 
atgcgaaacg atcctcatcc tgtctcttga tcagatcttg atcccctgcg ccatcagatc 3716 
cttggcggca agaaagccat ccagtttact ttgcagggct tcccaacctt accagagggc 377 6 
gccccagctg gcaattcc 3794 
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<210> 12 
<211> 401 
<212> PRT 

<213> Escherichia coli 
<400> 12 

Met Asn Val Phe Asn Pro Ala Gin Phe Arg Ala Gin Phe Pro Ala Leu 
1 t 5 10 15 

Gin Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro 
20 25 30 

Glu Ala Val Val Glu Ala Thr Gin Gin Phe Tyr Ser Leu Ser Ala Gly 
35 40 45 

Asn Val His Arg Ser Gin Phe Ala Glu Ala Gin Arg Leu Thr Ala Arg 
50 55 60 

Tyr Glu Ala Ala Arg Glu Lys Val Ala Gin Leu Leu Asn Ala Pro Asp 
65 70 75 80 

Asp Lys Thr lie Val Trp Thr Arg Gly Thr Thr Glu Ser lie Asn Met 

85 90 95 

Val Ala Gin Cys Tyr Ala' Arg Pro Arg Leu Gin Pro Gly Asp Glu lie 
100 105 110 

lie Val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met 
115 120 125 

Val Ala Gin Gin Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala 
130 135 140 

Gin Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu lie Thr Pro Arg 
145 150 155 160 

Ser Arg lie Leu Ala Leu Gly Gin Met Ser Asn Val Thr Gly Gly Cys 
165 170 175 

Pro Asp Leu Ala Arg Ala lie Thr Phe Ala His Ser Ala Gly Met Val 
180 185 190 

Val Met Val Asp Gly Ala Gin Gly Ala Val His Phe Pro Ala Asp Val 

_ s _ _ 2oq 205 

Gin Gin Leu Asp lie Asp Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr 
210 215 220 



Gly Pro Thr Gly lie Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu 
225 230 235 240 
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Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser 
245 250 255 

Phe Asp Gly Phe Thr Thr Gin Ser Ala Pro Trp Lys Leu Glu Ala Gly 
260 265 270 

Thr Pro Asn Val Ala Gly Val lie Gly Leu Ser Ala Ala Leu Glu Trp 
275 280 285 

Leu Ala Asp Tyr Asp He Asn Gin Ala Glu Ser Trp Ser Arg Ser Leu 
290 295 300 

Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser 
305 310 315 320 

Phe Arg Cys Gin Asp Ser Ser Leu Leu Ala Phe Asp Phe Ala Gly Val 
325 330 335 

His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly He Ala Leu 
340 345 350 

Arg Ala Gly Gin His Cys Ala Gin Pro Leu Leu Ala Glu Leu Gly Val 
355 360 365 

Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp 
370 375 380 

Val Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu Leu Leu Val 
385 390 395 400 

Asp 



<210> 13 
<211> 4975 
<212> DNA 

<213> Escherichia coli 

<220> 
<221> CDS 

<222> (530) . . (1684) 
<220> 

<2~21> CDS — 

<222> (1782) . . (2987) 

<400> 13 

gacgtctgtg tggaattgtg agcggataac aatttcacac agggccctcg gacaccgagg 
agaatgtcaa gaggcgaaca cacaacgtct tggagcgcca gaggaggaac gagctaaaac 
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ggagcttttt tgccctgcgt gaccagatcc cggagttgga aaacaatgaa aaggccccca 180 

aggtagttat ccttaaaaaa gccacagcat acatcctgtc cgtccaagca gaggagcaaa 240 

age teat ttc tgaagaggac ttgttgcgga aacgacgaga acagttgaaa cacaaacttg 300 

aacagctacg gaactcttgt gcgtaaggaa aagtaaggaa aacgattcct tctaacagaa 360 

atgtcctgag caatcaccta tgaactgtcg actcgagata gcatttttat ccataagatt 42 0 

agccgatcct aaggtttaca attgtgagcg ctcacaatta tgatagattc aattgtgagc 480 

ggataacaat ttcacacacg etageggtae caaagaggag aaattaact atg gca aaa 538 

Met Ala Lys 
1 



cac ctt ttt acg tec gag tec gtc tct gaa ggg cat cct gac aaa att 
His Leu Phe Thr Ser Glu Ser Val Ser Glu Gly His Pro Asp Lys lie 
5 10 15 

get gac caa att tct gat gee gtt tta gac gcg ate etc gaa cag gat 
Ala Asp Gin lie Ser Asp Ala Val Leu Asp Ala lie Leu Glu Gin Asp 
20 25 30 35 

ccg aaa gca cgc gtt get tgc gaa ace tac gta aaa ace ggc atg gtt 
Pro Lys Ala Arg Val Ala Cys Glu Thr Tyr Val Lys Thr Gly Met Val 

40 . 45 50 

tta gtt ggc ggc gaa ate ace ace age gec tgg gta gac ate gaa gag 
Leu Val Gly Gly Glu lie Thr Thr Ser Ala Trp Val Asp He Glu Glu 
55 60 65 

ate acc cgt aac acc gtt cgc gaa att ggc tat gtg cat tec gac atg 
He Thr Arg Asn Thr Val Arg Glu He Gly Tyr Val His Ser Asp Met 
70 75 80 

ggc ttt gac get aac tec tgt gcg gtt ctg age get ate ggc aaa cag 
Gly Phe Asp Ala Asn Ser Cys Ala Val Leu Ser Ala He Gly Lys Gin 
85 90 95 

tct cct gac ate aac cag ggc gtt gac cgt gec gat ccg ctg gaa cag 
Ser Pro Asp He Asn Gin Gly Val Asp Arg Ala Asp Pro Leu Glu Gin 
100 105 HO H5 



ggc gcg ggt gac cag ggt ctg atg ttt ggc tac gca act aat gaa acc 
Gly Ala Gly Asp Gin Gly Leu Met Phe Gly Tyr Ala Thr Asn Glu Thr 
120 125 130 

gac gtg ctg atg cca gca cct ate acc tat gca cac cgt ctg gta cag 
Asp Val Leu Met Pro Ala Pro He Thr Tyr Ala His Arg Leu Val Gin 



586 



634 



682 



730 



778 



82 6 



874 



922 



970 
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135 140 145 

cgt cag get gaa gtg cgt aaa aac ggc act ctg ccg tgg ctg cgc ccg 1018 ' 
Arg Gin Ala Glu Val Arg Lys Asn Gly Thr Leu Pro Trp Leu Arg Pro 
150 155 160 

gac gcg aaa age cag gtg act ttt cag tat gac gac ggc aaa ate gtt 1066 
Asp Ala Lys Ser Gin Val Thr Phe Gin Tyr Asp Asp Gly Lys lie Val 
165 170 175 

ggt ate gat get gtc gtg ctt tec act cag cac tct gaa gag ate gac 1114 
Gly lie Asp Ala Val Val Leu Ser Thr Gin His Ser Glu Glu lie Asp 
180 185 190 195 

cag aaa teg ctg caa gaa gcg gta atg gaa gag ate ate aag cca att 1162 
Gin Lys Ser Leu Gin Glu Ala Val Met Glu Glu lie lie Lys Pro lie 
200 205 210 

ctg ccc get gaa tgg ctg act tct gec acc aaa ttc ttc ate aac ccg 1210 
Leu Pro Ala Glu Trp Leu Thr Ser Ala Thr Lys Phe Phe lie Asn Pro 
215 220 225 

acc ggt cgt ttc gtt ate ggt ggc cca atg ggt gac tgc ggt ctg act 1258 
Thr Gly Arg Phe Val lie Gly Gly Pro Met Gly Asp Cys Gly Leu Thr 
230 235 240 

ggt cgt aaa att ate gtt gat acc tac ggc ggc atg gcg cgt cac ggt 1306 
Gly Arg Lys lie lie Val Asp Thr Tyr Gly Gly Met Ala Arg His Gly 
245 250 255 

ggc ggt gca ttc tct ggt aaa gat cca tea aaa gtg gac cgt tec gca 1354 
Gly Gly Ala Phe Ser Gly Lys Asp Pro Ser Lys Val Asp Arg Ser Ala 
260 265 270 275 

gee tac gca gca cgt tat gtc gcg aaa aac ate gtt get get ggc ctg 1402 
Ala Tyr Ala Ala Arg Tyr Val Ala Lys Asn lie Val Ala Ala Gly Leu 
2 80 2 85 290 

gec gat cgt tgt gaa att cag gtt tec tac gca ate ggc gtg get gaa 1450 
Ala Asp Arg Cys Glu lie Gin Val Ser Tyr Ala lie Gly Val Ala Glu 
295 300 305 

ccg acc tec ate atg gta gaa act ttc ggt act gag aaa gtg cct tct 1498 
Pro Thr Ser lie Met Val Glu Thr Phe Gly Thr Glu Lys Val Pro Ser 

3 IrO- - — — — 3-15 — 32 0 — - - - 



gaa caa ctg acc ctg ctg gta cgt gag ttc ttc gac ctg cgc cca tac 1546 
Glu Gin Leu Thr Leu Leu Val Arg Glu Phe Phe Asp Leu Arg Pro Tyr 
325 330 335 



ggt ctg att cag atg ctg gat ctg ctg cac ccg ate tac aaa gaa acc 



1594 
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Gly Leu He Gin Met Leu Asp Leu Leu His Pro He Tyr Lys Glu Thr 
340 345 350 355 

gca gca tac ggt cac ttt ggt cgt gaa cat ttc ccg tgg gaa aaa acc 1642 
Ala Ala Tyr Gly His Phe Gly Arg Glu His Phe Pro Trp Glu Lys Thr 
360 365 370 



gac aaa gcg cag ctg ctg cgc gat get gec ggt ctg aag taa 1684 
Asp Lys Ala Gin Leu Leu Arg Asp Ala Ala Gly Leu Lys 

375 380 385 

teggtacegg gccccccctc gaggtcgacg gtatcgataa gcttgatatc gaattcctgc 1744 

ageceggggg atcccatggt aegegtcgag gagtacc atg aac gtt ttt aat ccc 179 9 

Met Asn Val Phe Asn Pro 
390 



gcg cag ttt cgc gec cag ttt ccc gca eta cag gat gcg ggc gtc tat 1847 
Ala Gin Phe Arg Ala Gin Phe Pro Ala Leu Gin Asp Ala Gly Val Tyr 
395 400 405 



etc gac age gec gcg acc gcg ctt aaa cct gaa gee gtg gtt gaa gee 1895 

Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro Glu Ala Val Val Glu Ala 
410 415 420 

acc caa cag ttt tac agt ctg age gec gga aac gtc cat cgc age cag 1943 

Thr Gin Gin Phe Tyr Ser Leu Ser Ala Gly Asn Val His Arg Ser Gin 

425 430 435 



ttt gee gaa gee caa cgc ctg acc gcg cgt tat gaa get gca cga gag 1991 

Phe Ala Glu Ala Gin Arg Leu Thr Ala Arg Tyr Glu Ala Ala Arg Glu 

440 445 450 455 

aaa gtg gcg caa tta ctg aat gca ccg gat gat aaa act ate gtc tgg 2 039 

Lys Val Ala Gin Leu Leu Asn Ala Pro Asp Asp Lys Thr He Val Trp 

460 465 470 



acg cgc ggc acc act gaa tec ate aac atg gtg gca caa tgc tat gcg 2087 
Thr Arg Gly Thr Thr Glu Ser lie Asn Met Val Ala Gin Cys Tyr Ala 
475 480 485 



gag att att gtc age gtg gca gaa 2135 
Glu He He Val Ser Val Ala Glu 
500 



cgt ccg cgt ctg caa ccg ggc gat 
Arg Pro Arg Leii Gin Pro Gly Asp 
490 495 



cac cac gee aac etc gtc ccc tgg ctg 
His His Ala Asn Leu Val Pro Trp Leu 
505 510 

gec aaa gtg gtg aaa ttg ccg ctt aat 
Ala Lys Val Val Lys Leu Pro Leu Asn 



atg gtc gee caa caa act gga 2183 
Met Val Ala Gin Gin Thr Gly 
515 

gcg cag cga ctg ccg gat gtc 2231 
Ala Gin Arg Leu Pro Asp Val 
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535 



gat ttg ttg cca gaa ctg att act ccc cgt agt egg att ctg gcg ttg 2279 
Asp Leu Leu Pro Glu Leu He Thr Pro Arg Ser Arg He Leu Ala Leu 
540 545 550 

ggt cag atg teg aac gtt act ggc ggt tgc ccg gat ctg gcg cga gcg 2327 
Gly Gin Met Ser Asn Val Thr Gly Gly Cys Pro Asp Leu Ala Arg Ala 
555 560 565 

att acc ttt get cat tea gee ggg atg gtg gtg atg gtt gat ggt get 2375 
He Thr Phe Ala His Ser Ala Gly Met Val Val Met Val Asp Gly Ala 
570 575 580 

cag ggg gca gtg cat ttc ccc gcg gat gtt cag caa ctg gat att gat 2423 
Gin Gly Ala Val His Phe Pro Ala Asp Val Gin Gin Leu Asp He Asp 
585 590 595 

ttc tat get ttt tea ggt cac aaa ctg tat ggc ccg aca ggt ate ggc 2471 
Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr Gly Pro Thr Gly He Gly 
600 605 610 615 

gtg ctg tat ggt aaa tea gaa ctg ctg gag gcg atg teg ccc tgg ctg 2 519 
Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu Ala Met Ser Pro Trp Leu 
620 625 630 

ggc ggc ggc aaa atg gtt cac gaa gtg agt ttt gac ggc ttc acg act 2567 
Gly Gly Gly Lys Met Val His Glu Val Ser Phe Asp Gly Phe Thr Thr 
635 640 645 

caa tct gcg ccg tgg aaa ctg gaa get gga acg cca aat gtc get ggt 
Gin Ser Ala Pro Trp Lys Leu Glu Ala Gly Thr Pro Asn Val Ala Gly 
650 655 660 

gtc ata gga tta age gcg gcg ctg gaa tgg ctg gca gat tac gat ate 
Val He Gly Leu Ser Ala Ala Leu Glu Trp Leu Ala Asp Tyr Asp lie 
665 670 675 

aac cag gee gaa age tgg age cgt age tta gca acg ctg gcg gaa gat 2711 
Asn Gin Ala Glu Ser Trp Ser Arg Ser Leu Ala Thr Leu Ala Glu Asp 
680 685 690 695 

gcg ctg gcg aaa cgt ccc ggc ttt cgt tea ttc cgc tgc cag gat tec 2759 
_Ala_ Leu Ala Lys Arg Pro Gly Phe Arg Ser Phe Arg Cys Gin Asp Ser 

700 " 705 710 



age ctg ctg gee ttt gat ttt get ggc gtt cat cat age gat atg gtg 
Ser Leu Leu Ala Phe Asp Phe Ala Gly Val His His Ser Asp Met Val 
715 720 725 



2615 



2663 



2807 



acg ctg ctg gcg gag tac ggt att gee ctg egg gee ggg cag cat tgc 2855 
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Thr Leu Leu Ala Glu Tyr Gly He Ala Leu Arg Ala Gly Gin His Cys 
730 735 740 

get cag ccg eta ctg gca gaa tta ggc gta ace ggc aca ctg cgc gee 2 903 
Ala Gin Pro Leu Leu Ala Glu Leu Gly Val Thr Gly Thr Leu Arg Ala 
745 750 755 

tct ttt gcg cca tat aat aca aag agt gat gtg gat gcg ctg gtg aat 2 951 
Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp Val Asp Ala Leu Val Asn 
760 765 770 775 

gec gtt gac cgc gcg ctg gaa tta ttg gtg gat taa aegegtgeta 2 997 

Ala Val Asp Arg Ala Leu Glu Leu Leu Val Asp 
780 785 

gaggcatcaa ataaaacgaa aggctcagtc gaaagactgg gectttegtt ttatctgttg 3057 

tttgtcggtg aacgctctcc tgagtaggac aaatccgccg ccctagacct aggggatata 3117 

ttccgcttcc tcgctcactg actcgctacg cteggtegtt cgactgcggc gageggaaat 3177 

ggcttacgaa eggggeggag atttcctgga agatgecagg aagatactta acagggaagt 3237 

gagagggecg cggcaaagcc gtttttccat aggctccgcc cccctgacaa gcatcacgaa 32 97 

atetgacget caaatcagtg gtggcgaaac ccgacaggac tataaagata ccaggcgttt 33 57 

ccccctggcg gctccctcgt gcgctctcct gttcctgcct ttcggtttac cggtgtcatt 3417 

ccgctgttat ggccgcgttt gtctcattcc acgcctgaca ctcagttccg ggtaggcagt 3477 

tcgctccaag ctggactgta tgcacgaacc ccccgttcag tccgaccgct gcgccttatc 35 37 

eggtaactat cgtcttgagt ccaacccgga aagacatgea aaagcaccac tggcagcagc 35 97 

cactggtaat tgatttagag gagttagtct tgaagtcatg cgccggttaa ggctaaactg 3 6 57 

aaaggacaag ttttggtgac tgcgctcctc caagecagtt acctcggttc aaagagttgg 3717 

tagctcagag aaccttcgaa aaaccgccct geaaggeggt tttttcgttt tcagagcaag 3777 

agattacgeg cagaccaaaa cgatctcaag aagatcatct tattaatcag ataaaatatt 3 837 

tctagatttc agtgcaattt atctcttcaa atgtagcacc tgaagtcagc cccatacgat 3897 



ataagttgtt actagtgett ggattctcac caataaaaaa cgcccggcgg caaccgagcg 3957 
ttctgaacaa atccagatgg agttctgagg tcattactgg atctatcaac aggagtccaa 4017 
gcgagctctc gaaccccaga gtcccgctca gaagaactcg tcaagaaggc gatagaaggc 4077 
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gatgcgctgc gaatcgggag cggcgatacc gtaaagcacg aggaagcggt cagcccattc 4137 
gccgccaagc tcttcagcaa catcacgggt agccaacgct atgtcctgat agcggtccgc 41S7 
cacacccagc cggccacagt cgatgaatcc agaaaagcgg ccattttcca ccatgatatt 42 57 
cggcaagcag gcatcgccat gggtcacgac gagatcctcg ccgtcgggca tgcgcgcctt 4317 
gagcctggcg aacagttcgg ctggcgcgag cccctgatgc tcttcgtcca gatcatcctg 4377 
atcgacaaga ccggcttcca tccgagtacg tgctcgctcg atgcgatgtt tcgcttggtg 4437 
gtcgaatggg caggtagccg gatcaagcgt atgcagccgc cgcattgcat cagccatgat 4497 
ggatactttc tcggcaggag caaggtgaga tgacaggaga tcctgccccg gcacttcgcc 4557 
caatagcagc cagtcccttc ccgcttcagt gacaacgtcg agcacagctg cgcaaggaac 4617 
gcccgtcgtg gccagccacg atagccgcgc tgcctcgtcc tgcagttcat tcagggcacc 4 677 
ggacaggtcg gtcttgacaa aaagaaccgg gcgcccctgc gctgacagcc ggaacacggc 4737 
ggcatcagag cagccgattg tctgttgtgc ccagtcatag ccgaatagcc tctccaccca 47 97 
agcggccgga gaacctgcgt gcaatccatc ttgttcaatc atgcgaaacg atcctcatcc 4857 
tgtctcttga tcagatcttg atcccctgcg ccatcagatc cttggcggca agaaagccat 4917 
ccagtttact ttgcagggct tcccaacctt accagagggc gccccagctg gcaattcc 4975 



<210> 14 
<211> 384 
<212> PRT 

<213> Escherichia coli 
<400> 14 

Met Ala Lys His Leu Phe Thr Ser Glu Ser Val Ser Glu Gly His Pro 
15 10 15 

Asp Lys lie Ala Asp Gin lie Ser Asp Ala Val Leu Asp Ala lie Leu 
20 25 30 

Glu Gin Asp Pro Lys Ala Arg Val Ala Cys Glu Thr Tyr Val Lys Thr 

■ 35 — 4 - 0 45 — — 



Gly Met Val Leu Val Gly Gly Glu lie Thr Thr Ser Ala Trp Val Asp 

50 55 60 

lie Glu Glu lie Thr Arg Asn Thr Val Arg Glu lie Gly Tyr Val His 

65 70 75 80 
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Ser Asp Met Gly Phe Asp Ala Asn Ser Cys Ala Val Leu Ser Ala lie 

65 SO 95 

Gly Lys Gin Ser Pro Asp lie Asn Gin Gly Val Asp Arg Ala Asp Pro 
100 105 110 

Leu Glu Gin Gly Ala Gly Asp Gin Gly Leu Met Phe Gly Tyr Ala Thr 
115 120 125 

Asn Glu Thr Asp Val Leu Met Pro Ala Pro lie Thr Tyr Ala His Arg 
130 135 140 

Leu Val Gin Arg Gin Ala Glu Val Arg Lys Asn Gly Thr Leu Pro Trp 
145 150 155 160 

Leu Arg Pro Asp Ala Lys Ser Gin Val Thr Phe Gin Tyr Asp Asp Gly 
165 170 175 

Lys lie Val Gly lie Asp Ala Val Val Leu Ser Thr Gin His Ser Glu 
180 185 190 

Glu lie Asp Gin Lys Ser Leu Gin Glu Ala Val Met Glu Glu lie lie 
195 200 205 

Lys Pro lie Leu Pro Ala Glu Trp Leu Thr Ser Ala Thr Lys Phe Phe 
210 215 220 

lie Asn Pro Thr Gly Arg Phe Val lie Gly Gly Pro Met Gly Asp Cys 
225 230 . 235 240 

Gly Leu Thr Gly Arg Lys lie lie Val Asp Thr Tyr Gly Gly Met Ala 
245 250 255 

Arg His Gly Gly Gly Ala Phe Ser Gly Lys Asp Pro Ser Lys Val Asp 
260 265 270 

Arg Ser Ala Ala Tyr Ala Ala Arg Tyr Val Ala Lys Asn lie Val Ala 
275 280 285 

Ala Gly Leu Ala Asp Arg Cys Glu lie Gin Val Ser Tyr Ala lie Gly 
290 295 300 

Val Ala Glu Pro Thr Ser lie Met Val Glu Thr Phe Gly Thr Glu Lys 
"305 3T0— 315— — — —3-20 



Val Pro Ser Glu Gin Leu Thr Leu Leu Val Arg Glu Phe Phe Asp Leu 
325 330 335 



Arg Pro Tyr Gly Leu lie Gin Met Leu Asp Leu Leu His Pro lie Tyr 
340 345 350 
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Lys Glu Thr Ala Ala Tyr Gly His Phe Gly Arg Glu His Phe Pro Trp 
355 360 365 

Glu Lys Thr Asp Lys Ala Gin Leu Leu Arg Asp Ala Ala Gly Leu Lys 
370 375 380 



<210> 15 
<211> 401 
<212> PRT 

<213> Escherichia coli 
<400> 15 

Met Asn Val Phe Asn Pro Ala Gin Phe Arg Ala Gin Phe Pro Ala Leu 
15 10 15 

Gin Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro 
20 25 30 

Glu Ala Val Val Glu Ala Thr Gin Gin Phe Tyr Ser Leu Ser Ala Gly 
35 40 45 

Asn Val His Arg Ser Gin Phe Ala Glu Ala Gin Arg Leu Thr Ala Arg 
50 55 60 

Tyr Glu Ala Ala Arg Glu Lys Val Ala Gin Leu Leu Asn Ala Pro Asp 

65 70 r - ' \ 75 80 

Asp Lys Thr lie Val Trp Thr Arg Gly Thr Thr Glu Ser lie Asn Met 

85 90 95 

Val Ala Gin Cys Tyr Ala Arg Pro Arg Leu Gin Pro Gly Asp Glu lie 
100 105 110 

lie Val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met 

115 12 0 - 12 5 - 

Val Ala Gin Gin Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala 
130 135 140 

Gin Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu lie Thr Pro Arg 
145 150 155 160 

„S_er__Ar.g_IXe._Leu_Ala_Leu-Gly^ 

165 170 175 

Pro Asp Leu Ala Arg Ala lie Thr Phe Ala His Ser Ala Gly Met Val 
180 185 190 



Val Met Val Asp Gly Ala Gin Gly Ala Val His Phe Pro Ala Asp Val 
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195 200 205 

Gin Gin Leu Asp lie Asp Phe Tyr Ala Phe Ser Gly Kis Lys Leu Tyr 
210 215 220 

Gly Pro Thr Gly lie Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu 
225 230 235 240 

Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser 
245 250 255 

Phe Asp Gly Phe Thr Thr Gin Ser Ala Pro Trp Lys Leu Glu Ala Gly 
260 265 270 

Thr Pro Asn Val Ala Gly Val lie Gly Leu Ser Ala Ala Leu Glu Trp 
275 280 285 

Leu Ala Asp Tyr Asp lie Asn Gin Ala Glu Ser Trp Ser Arg Ser Leu 
290 295 300 

Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser 
305 310 315 320 

Phe Arg Cys Gin Asp Ser Ser Leu Leu Ala Phe Asp Phe Ala Gly Val 
325 330 335 

His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly lie Ala Leu 
340 345 350 

Arg Ala Gly Gin His Cys Ala Gin Pro Leu Leu Ala Glu Leu Gly Val 
355 360 365 

Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp 
370 375 380 

Val Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu Leu Leu Val 
385 390 395 400 
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INTERN ATIONALER VORLAUFIGER 

PRUFUNGSBERICHT Internationales Aktenzeichen PCT/EP99/01 052 



I. Grundlag des Berichts 

1 . Dieser Bericht wurde erstellt auf der Grundlage (Ersatzblatter, die dem Anmeldeamt auf eine Aufforderung nach 
Artikel 14 hin vorgefegt wurden, gelten im Rahmen dieses Berichts als "ursprunglich eingereicht" und sind ihm 
nicht beigefugt, weil sie keine Anderungen enthalten.): 

Beschreibung, Seiten: 

1-15 ursprungliche Fassung 

Patentanspriiche, Nr.: 

1-14 ursprungliche Fassung 

Zeichnungen, Blatter: 

1/2-2/2 ursprungliche Fassung 

2. Aufgrund der Anderungen sind folgende Unterlagen fortgefallen: 

□ Beschreibung, Seiten: 

□ Anspruche, Nr.: 

□ Zeichnungen, Blatt: 

3. □ Dieser Bericht ist ohne Berucksichtigung (von einigen) der Anderungen erstellt worden, da diese aus den 

angegebenen Grunden nach Auffassung der Behorde uber den Offenbarungsgehalt in der ursprunglich 
eingereichten Fassung hinausgehen (Regel 70.2(c)): 

4. Etwaige zusatzliche Bemerkungen: 

siehe Beiblatt 
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PRUFUNGSBERICHT 



Internationales Aktenzeichen PCT/EP99/01 052 



V. Begrundete Feststellung nach Artikel 35(2) hinsichtlich der Neuheit ; der erfinderischen Tatigkeit und der 
gewerblichen Anwendbarkeit; Unterlagen und Erklarungen zur Stutzung dieser Feststellung 

1. Feststellung 

Neuheit (N) Ja: Anspruche 1-14 

Nein: Anspruche 

Erfinderische Tatigkeit (ET) Ja: Anspruche 

Nein: Anspruche 1-14 

Gewerbliche Anwendbarkeit (G A) Ja: Anspruche 1-14 

Nein: Anspruche 



2. Unterlagen und Erklarungen 
siehe Beiblatt 

VI. Bestimmte angefuhrte Unterlagen 

1. Bestimmte veroffentlichte Unterlagen (Regel 70.10) 
und /oder 

2. Nicht-schriftliche Offenbarungen (Regel 70.9) 
siehe Beiblatt 

VIII. Bestimmte Bemerkungen zur internationalen Anmeldung 

Zur Klarheit der Patentanspruche. der Beschreibung und der Zeichnungen oder zu der Frage, ob die Anspruche 
in vollem Umfang durch die Beschreibung gestutzt werden. istfolgendes zu bemerken: 

siehe Beiblatt 
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PRUFUNGSBERICHT - BEIBLATT 

Zu Punkt I, Paragraph 4, Zusatzliche Bemerkungen 

Zu der Anmeldung gehort ein Sequenzprotokoll numeriert von Blatt 1 bis 36. 
Zu Punkt V 

1 . Es wird auf die folgenden Dokumente verwiesen: 

D1: EP-A-0 806 479 

D2: PAJ vol. 098, no. 001, 30.01.1998 

D3: Database EMBL, Accession Number H64925, 12.09.1997 
D4: Database EMBL, Accession Number F65063, 12.09.1997 
D5: Database SWISSPROT, Accession Number P39171, 01.02.1995 

2.1 Laut Beschreibung (siehe Seite 4) lag der vorliegenden Erfindung die Aufgabe 
zugrunde, ein technisches, fermentatives Verfahren zur Herstellung von Biotin zu 
entwickeln, das eine moglichst hohe Biotinsynthese zeigt. Die Aufgabe wurde 
mittels einem Vefrfahren zur Herstellung von Biotin, gekennzeichnet durch die 
Expression und Synthese von Biotin in einem Wirtsorganismus aufgrund eines 
Genkonstrukts beinhaltend ein- SAM (S-Adenosyl-Methionin)-Synthase-Gen in 
Kombination mit mindestens einem Biotin Biosynthesegen (bioS1, bioS2 oder 
bioS3) gelost. 

2.2 Im Hinblick auf den Stand der Technik wird der Gegenstand der Anspruche 1-14 
als neu betrachtet. Angesichts der gentechnischen Produktion von Biotin ist das 
SAM-Synthase-Gen aus D2 bekannt. Auch die bioS Geneprodukte werden im 
Stand der Technik offenbart (bioSl, siehe D4; bioS2, s. D5; bioS3, s. D3), jedoch 
nicht im Zusammenhang mit der Produktion von Biotin (beziiglich des Dokuments 
WO-A- 99 05285, zitiert im internationalen Recherchenbericht als P,A-Dokument, 
siehe nachstehender Punkt VI). Somit ist die Kombination dieser bekannten 
Gene, wie sie im Genkonstrukt der vorliegenden Anmeldung beansprucht wird, 
nicht im Stand der Technik offenbart. 

2.3 Im Hinblick auf den Stand der Technik beruht der Gegenstand der Anspruche 1- 
14 , in der vorliegenden Fassung, nicht auf einer erfinderischen Tatigkeit: 
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(a) Wie oben erwahnt (s. Absatz 2.2), sind im Stand der Technik die bioS Gene 
nicht im Zusammenhang mit der Produktion von Biotin beschrieben worden. 
AuBerdem ist deren Kombination wie sie in der vorliegenden Anmeldung 
beansprucht wird, nicht bekannt. Da die bioS Proteinen, laut dem Stand der 
Technik, der Superfamilie der nifS Proteine zugewiesen werden (siehe z.B. 
Dokument D3), konnte die fermentative Produktion von Biotin mittels nifS 
Genprodukten (D1) als nachstliegender Stand der Technik bewertet werden. In 
diesem Dokument wird auf S-Adenosylmethionin hingewiesen, jedoch nicht auf 
das SAM-Synthase Gen. Dokument D2, hingegen, beschreibt die gentechnische 
Produktion von Biotin mittels einem rekombinanten Plasmid, das das SAM- 
Synthase Gen und das Biotin-Operon enthalt. Da die bioS Gene nicht unmittelbar 
aus D1 und D2 abzuleiten sind, beruht der Gegenstand ri^r Anspruche 1-14, 
unserer Meinung nach, auf einer erfinderischen Tatigkeit, insoweit als dieser 
Gegenstand nur durch die bioS Gene definiert wird und nicht durch deren 
funktionelien Varianten, Analogen oder Derivate. 

(b) Die funktionelien Varianten, Analoge oder Derivate umfassen unter anderem 
die bekannten nifS Gene (s. D1). Der Anmelder erwahnt diese Tatsache auf Seite 
5 der Beschreibung (s. 2. Abschnitt). Die Kombination der nifS Gene aus D1 mit 
der SAM-Synthase aus D2 ist naheliegend fur die Fachperson, auch wenn die 
nifS Gene in D1 aus Klebsiella pneumoniae (s. D1, Beispiel 2, S. 6) stammen und 
nicht aus E. coli , wo die bioS Gene abgeleitet worden sind (laut dem Stand der 
Technik D3, D4 und D5); den Hinweis zu dieser Kombination (D1-D2) bekommt 
die Fachperson uber das Biotin-Opern, das im Stand der Technik (siehe z.B. EP- 
B--0 236 429 oder WO-A-94 08023, beide in der vorliegenden Anmeldung zitiert, s. 
S. 3, vorletzter Abschnitt) beschrieben wird. So werden, laut WO-A- 94 08023, die 
bereits klonierten Biotinsynthesegene (z.B. bioA und bioB des Biotin-Operons) in 
ein biotechnologisches Verfahren zur Herstellung von Biotin einbezogen. Das 
bioB Gen wird auch in D1 eingesetzt und zwar in Verbindung mit nifS. Jedoch wird 
das bioB Gen in der vorliegenden Erfindung erst ab Anspruch 5 eingesetzt. 
Trotz dem sind wir de r Meinung , d a(3 die Verb indung der Dokumente D1 und D2 
uber die oben genannten funktionelien Varianten nifS und die Biotin-Operon Gene 
(z.B. bioB) als naheliegend betrachtet werden kann. Somit beruht der Gegenstand 
der Anspruche 1-14 . in der vorliegenden Fassung, nicht auf einer erfinderischen 
Tatigkeit. 
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Zu Punkt VI 

2.4 Es wird nach Regel 64.3 und 70.10 PCT auf die Anmeldung WO-A-99 05285 
hingewiesen. Sie hat ein Veroffentlichungsdatum vom 04.02.1999, ein 
Anmeldedatum vom 02.07.1998 und ein beanspruchtes Prioritatsdatum vom 
22.07.1997; sie gilt jedoch nicht ats Stand der Technik fur die internationale 
vorlaufige Prufung nach Artikel 33(2) und (3) im PCT-Verfahren. Diese 
Anmeldung offenbart die bioS1 und bioS2 Gene im Zusammenhang mit der 
gentechnischen Herstellung von Biotin. 

Zu Punkt VIII 

3. Die im Recherchenbericht genannten Dokumente D1-D4, aus denen sich der 
zugrundeliegende Stand der Technik ergibt, sind nicht in der Beschreibung 
angegeben (Regel 5.1 (a)(ii) PCT). 

m01-t84 
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VERTRAG 



ER DIE INTERNATIONALE ZU^KM EN ARBEIT 




DEM GEBIET DES PATENTWI^NS 

PCT 

INTERN ATIONALER RECHERCHENBERICHT 

(Artikel 18 sowie Regeln 43 und 44 PCT) 



Aktenzeichen des Anmelders Oder Anwalts 

0050/048792 


WEITERES siehe Mitteiiung uber die Ubermittlung des Internationale n 

Recherchenberichts (Formblatt PCT/ISA/220) sowie, soweit 
VORGEHEN zutreffend. nachstehender Punkt 5 


Internationales Aktenzeichen 
PCT/EP 99/01052 


Internationales Anmeldedatum 
(Tag/Monat/Jahr) 

17/02/1999 


(Fruhestes) Prioritatsdatum (Tag/Monat/Jahr) 

19/02/1998 


Anmelder 

BASF AKTIENGESELLSCHAFT et al . 



Dieser internationale Recherchenbericht wurde von der Internationalen Recherchenbehorde erstellt und wird dem Anmelder gemaG 
Artikel 18 ubermittelt. Eine Kopie wird dem Internationalen Buro ubermittelt. 

Dieser internationale Recherchenbericht umfaGt insgesamt _3 Blatter. 

[X] Dariiber hinaus liegt ihm jeweils eine Kopie der in diesem Bericht genannten Unterlagen zum Stand der Technik bei. 



1. Grundlage des Bertchts 

a. Hinsichtlich der Sprache ist die internationale Recherche auf der Grundlage der internationalen Anmeldung in der Sprache 
durchgefuhrt worden, in der sie eingereicht wurde, sofern unter diesem Punkt nichts anderes angegeben ist. 

| | Die internationale Recherche ist auf der Grundlage einer bei der Behorde eingereichten Ubersetzung der internationalen 
Anmeldung (Regel 23.1 b)) durchgefuhrt worden. 

Hinsichtlich der in der internationalen Anmeldung offenbarten Nucleotid- und/oder Aminosauresequenz ist die internationale 
Recherche auf der Grundlage des Sequenzprotokolls durchgefuhrt worden. das 
|~X~| in der internationalen Anmeldung in Schriflicher Form enthalten ist. 

| | zusammen mit der internationalen Anmeldung in computerlesbarer Form eingereicht worden ist. 
bei der Behorde nachtraglich in schriftlicher Form eingereicht worden ist. 
bei der Behorde nachtraglich in computerlesbarer Form eingereicht worden ist. 



b. 



□ 



Die Erklarung, daG das nachtraglich eingereichte schriftliche Sequenzprotokoll nicht uber den Offenbarungsgehalt der 
internationalen Anmeldung im Anmeldezeitpunkt hinausgeht, wurde vorgelegt. 

| | Die Erklarung, daB die in computerlesbarer Form erfaBten Informationen dem schriftlichen Sequenzprotokoll entsprechen, 
wurde vorgelegt. 

| | Bestimmte Anspriiche haben sich als nicht recherchierbar erwiesen (siehe Feld I). 
| | Mangelnde Einheitlichkeit der Erfindung (siehe Feld II). 



4. Hinsichtlich der Bezeichnung der Erfindung 

j~X~| wird der vom Anmelder eingereichte Wortlaut genehmigt. 
| | wurde der Wortlaut von der Behorde wie folgt festgesetzt: 



Hinsichtlich der Zusammenfassung 



|~^~] wird der vom Anmelder eingereichte Wortlaut genehmigt. 

wurde der Wortlaut nach Regel 38.2b) in der in Feld Ml angegebenen Fassung von der BehOrde festgesetzt. Der 
I [ Anmelder kann der Behorde innerhalb eines Monats nach dem Datum der Absendung dieses internationalen 

Recherchenberichts eine Stellungnahme vorlegen. 

6. Folgende Abbildung der Zeichnungen ist mit der Zusammenfassung zu veroffentlichen: Abb. Nr. 



| | wie vom Anmelder vorgeschlagen [X] keine der Abb. 

| | weil der Anmelder selbst keine Abbildung vorgeschlagen hat. 
| | weil diese Abbildung die Erfindung besser kennzeichnet. 
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INTERNATIONALER RECHERCHENBERICHT 



^P'EP 99/01052 



A. KLASSIFIZIERUNG DES ANMELDUNGSGEGENSTANOES 

IPK 6 C12N15/54 C12P17/18 C12N9/10 
C12R1: 19),(C12N1/21,C12R1:19) 



C12N1/21 //(C12P17/18, 



Nach der Internationalen Patentwasstfikation (iKK) oder nach der nationaien Kiassifikation und der iPK 



B. RECHERCH1ERTE GEBIETE 



Recherchierter Mindestprufstoff (Klassifikationssystem und Klassifikationssymbole ) 

IPK 6 C12N C12P 



Recherchierte aber nicht zum Mindestprufstoff gehdrende Veroffentlichungen, soweit diese unter die recherchierten Gebiete fallen 



Wahrend der internationalen Recherche konsuitierte elektronische Datenbank (Name der Datenbank und evtl. verwendete Suchbegriffe) 



C. ALS WESENTLICH ANGESEHENE UNTERLAGEN 



Kategorie 0 


Bezeichnung der Veroffentlichung, soweit erforderlich unter Angabe der in Betracht kommenden Teile 


Betr. Anspruch Nr. 


Y 


EP 0 806 479 A (HOFFMANN LA ROCHE) 


1-14 




12. November 1997 (1997-11-12) 






Zusammenf assung 






Seite 2, Zeile 25 - Zeile 37 






Bei spiel e 3,6,7,9 






Anspruch 3 




Y 


PATENT ABSTRACTS OF JAPAN 


1-14 




vol. 098, no. 001, 






30. Januar 1998 (1998-01-30) 






& JP 09 224690 A (SHISEIDO CO LTD;TAKEDA 






CHEM INO LTD), 






2. September 1997- (1997-09-02) 






Zusammenf assung 






-/-- 





Weitere Veroffentlichungen sind der Fortsetzung von Feld C zu 
entnehmen 



Siehe An hang Pate ntfami lie 



° Besondere Kategorien von angegebenen Veroffentlichungen 

"A" Veroffentlichung, die den allgemeinen Stand der Technik definiert, 
aber nicht als besonders bedeutsam arizusehen ist 



"E' 



alteres Dokument, das jedoch erst am oder nach dem internationalen 
-Anmeldedatum veroffentlicht worden ist 



"L" Veroffentlichung, die geeignet ist, einen Prioritatsanspruch zweifelhaft er- 
scheinen zu lassen, oder durch die das Verdffentlichungsdatum einer 
anderen im Recherchenbericht genannten Veroffentlichung belegt werden 
soil oder die aus einem anderen be sonde re n Grund angegeben ist (wie 
ausgefuhrt) 

J-'0"^Ver6ffentiichung,.die-sich.auLeine.mundliche_Orfenbarung l 



eine Benutzung, eine Ausstellung oderandere MaBnahmen bezieht 
"P" Veroffentlichung, die vor dem internationalen Anmeldedatum, aber nach 



T" Spatere Veroffentlichung, die nach dem internationalen Anmeldedatum 
oder dem Prioritatsdatum veroffentlicht worden ist und mit der 
Anmeldung nicht kollidiert, sondern nur zum Verstandnis des der 
Ertindung zugrundeliegenden Prinzips Oder der ihr zugrundeliegenden 
Theorie angegeben ist 

"X B Veroffentlichung von besonderer Bedeutung; die beanspruchte Ertindung 
kann allein aufgrund dieser Veroffentlichung nicht als neu oder auf 
erf inderischer Tatigkeit beruhend betrachtet werden 

"Y" Veroffentlichung von besonderer Bedeutung; die beanspruchte Ertindung 
kann nicht als auf erfinderischer Tatigkeit beruhend betrachtet 
werden, wenn die Veroffentlichung mit einer oder mehreren anderen 

^Veroffentlichungen.dieser.KategorieJn-Verbindung.gebrachtjwird.und 

diese Verbindung fur einen Fachmann naheliegend ist 

"& H Veroffentlichung, die Mitglied derseiben Patentfamilie ist 



Datum des Abschlusses der internationalen Recherche 

14. Juli 1999 


Absendedatum des internationalen Recherchenberichts 

27/07/1999 


Name und Postanschrift der Internationalen Recherchenbehdrde 
Europaisches Patentamt, P.B. 5818 Patentlaan 2 
NL - 2280 HV Rijswijk 
Tel. (+31-70) 340-2040, Tx. 31 651 epo nJ, 
Fax: (+31-70) 340-3016 


Bevollmachtigter Bediensteter 

Lejeune, R 
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C(Fortsetzung) ALS WESENTLICH ANGESEHENE UNTERLAGEN 



Kategorfe 0 


Bezeichnung der Veroffentlichung, so we it erforderlich unter Angabe der in Betracht kommenden Teile 


Betr. Anspruch Nr. 


Y 


r\ATAOAcr* r~ m n i 

DATABASE EMBL Online! 


13 




Accession Number H64925, 






12. September 1997 (1997-09-12) 






BLATTNER F R ET AL: "hypothetical protein 






bl680 - Escherichia coll (strain K-12) 






XP002109161 






ist identlsch zum BI0S3 




A 




1 1 O 1 A 

1-1Z , 14 


P,A 




WO 99 05285 A (SCHROEDER HARTWIG ;BASF AG 


1-14 




(DE); HAUER BERNHARD (DE)) 






4. Februar 1999 (1999-02-04) 






in der Anmeldung erwahnt 






das ganze Dokument 




A 


DATABASE EMBL Online! 


1 1 A 

1-14 




Accession Number F65063, 






12. September 1997 (1997-09-12) 






BLATTNER F R ET AL: hypothetical protein 






b2810 - Escherichia coll (strain K-12) 






XP002109162 






ist identisch zum BIOSl 




A 

A 


DATABASE SWISSPROT Online! 


1 1 A 

1-14 




Accession Number P39171, 






l. Februar 1995 (1995-02-01) 






BLATTNER F R ET AL: "NIFS protein homolog" 






XP002109163 






in der Anmeldung erwahnt 






ist identisch zum BI0S2 





— 








Fonmblat! PCT/ISA/210(Fortseizung von Blatt 2) (Juli 1992) 



Seite 2 von 2 



THIS PAGE BLANK (uspto) 



PCT/EP99/01052 



F ENT COOPERATION TREA 

From the INTERNATIONAL BUREAU 



PCT 

IMUI IrlLAIiUN Or ELECTION 
(PCT Rule 61.2) 


To: 

Assistant Commissioner for Patents 
United States Patent and Trademark 
Office 
Box PCT 

Washington, D.C.20231 
ETATS-UNIS D'AMERIQUE 

in its capacity as elected Office 


Date of mailing (day/month/year) 
21 October 1999 (21.10.99) 




International application No. 
PCT/EP99/01052 


Applicant's or agent's file reference 
0050/048792 


International filing date (day/month/year) 

17 February 1999(17.02.99) 


Priority date (day/month/year) 

19 February 1998(19.02.98) 


Applicant 

SCHRODER, Hartwig 



1. The designated Office is hereby notified of its election made: 

| X j in the demand filed with the International Preliminary Examining Authority on: 

10 August 1999(10.08.99) 



| | in a notice effecting later election filed with the International Bureau on: 



2. The election | X | 

□ 



was not 



made before the expiration of 19 months from the priority date or, where Rute-32 applies, within the time limit under 
Rule 32.2(b). 



The International Bureau of WIPO 


Authorized officer 


34, chemin des Colombettes 


Jean-Marie McAdams 


1211 Geneva 20, Switzerland 


Facsimile No.: (41-22) 740.14.35 


Telephone No.: (41-22) 338.83.38 



Form PCT/IB/331 (July 1992) 



2910961 



THIS 



PATENT COOPERATION TREATY 

PCT 



* v 4^ INTERNATIONAL PRELIMINARY EXAMINATION REPORT 



(PCT Article 36 and Rule 70) 



Applicant's or agent's file reference 
0050/048792 


FOR FURTHER ACTION Notiflcation of Transmittal of International 

Preliminary Examination Report (Form PCT/IPEA/416) 


International application No. 

PCT/EP99/01052 


International filing date {day/month/year) 
17 February 1999 (17.02.99) 


Priority date {day/month/year) 

19 February 1998 (19.02.98) 


International latent Classitication (IPC) or national classification and IPC 
C12N 15/54 


RECEIVED 

.IAN 1 1 7fmi 


Applicant 


BASF AKTIENGESELLSCHAFT 


TECH CENTER 1600/29(K 



ISnH^ a H° n l Prel ™!! ary u examination re P° rt has ^en prepared by this International Preliminary Examining 
Authority and is transmitted to the applicant according to Article 36. "fining 



2 . This REPORT consists of a total of 



. sheets, including this cover sheet. 



^ Z^i^^^^ ^ ,NEXES - i e " sheets of the Ascription, claims and/or drawings which have 

S ^r! 70 f r ^ b ^°l ^ reP ° rt and/ ° r SheetS containi "g rectifications made before this Author^ 
(see Rule 70. 1 6 and Section 607 of the Administrative Instructions under the PCT). Aumoniy 

These annexes consist of a total of sheets. 



3. This report contains indications relating to the following items: 
Basis of the report 
Priority 

Non-establishment of opinion with regard to novelty, inventive step and industrial applicability 
Lack of unity of invention 

f^£SX^i£^&fiS& to "° Velty - inventive ste P or industrial a PP'-bi.ity; 

Certain documents cited 
Certain defects in the international application 
Certain observations on the international application 



II 


□ 


III 


□ 


IV 


□ 


V 


ISI 


VI 


M 


VII 


□ 


VIII 


1X1 



10 August 1999 (10.08.99) 


Date of completion ot triis report 

02 May 2000 (02.05.2000) 


Name and mailing address of the IPEA/EP 
Facsimile No. 


Authorized officer 
Telephone No. 
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INTERNATIONAL PRELIMINARY EXAMINATION REPORT 



International application No. 

PCT/EP99/01052 



I. Basis of the report 



1 . This report has been drawn on the basis of {Replacement sheets which have been furnished to the receiving Office in response to an invitation 
under Article 14 are referred to in this report as "originally filed" and are not annexed to the report since they do not contain amendments.)'. 



the international application as originally filed. 
| | the description, pages 1-15 



| | the claims, 



pages 
pages 
pages 

Nos. 
Nos. 
Nos. 
Nos. 
Nos. 



1-14 



| | the drawings, 



sheets/fig 
sheets/fig 
sheets/fig 
sheets/fig 



1/2-2/2 



2. The amendments have resulted in the cancellation of 

□ 

the description, pages 

□ 

the claims, Nos. 



□ 

the drawings, sheets/fig 



as originally filed, 
. , filed with the demand, 
_ , filed with the letter of 
mJ filed with the letter of 



. , as originally filed, 
, as amended under Article 19, 

. , filed with the demand, 

, filed with the letter of 

, filed with the letter of 



. , as originally filed, 
, filed with the demand, 
, filed with the letter of 
, filed with the letter of 



3. □ ™ s reP 0 * has been established as if (some of) the amendments had not been made, since they have been considered 
i to go beyond the disclosure as filed, as indicated in the Supplemental Box (Rule 70.2(c)). 



4. Additional observations, if necessary: 
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INTERNATIONAL PRELIMINARY EXAMINATION REPORT 


International application No. 
PCT/EP 99/01052 






I. Basis of the report 


I . This report has been drawn on the basis of (Replacement sheets which have been furnished to the receiving Office in response to an invitation 
under Article 14 are referred to in this report as "originally filed" and are not annexed to the report since they do not contain amendments.) '. 

4. The application includes a sequence protocol 
numbered from sheet 1 to sheet 36. 

, . — 
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INTERNATIONAL PRELIMINARY EXAMINATION REPORT 



International application No. 
PCT/EP 99/01052 



V. Reasoned statement under Article 35(2) with regard to novelty, inventive step or industrial applicability; 
citations and explanations supporting such statement 



1 . Statement 

Novelty (N) 

Inventive step (IS) 
Industrial applicability (IA) 



Claims 
Claims 

Claims 
Claims 

Claims 
Claims 



1-14 



1-14 



1-14 



YES 
NO 
YES 
NO 

YES 
NO 



Citations and explanations 

1. The following documents are referred to: 



Dl: EP-A-0 806 479 

D2_: PAJ Vol. 098, N° 001, 30.01.1998 
D3: Database EMBL, Accession N° H64925, 12.09.1997 
D4 : Database EMBL, Accession N° F65063, 12.09.1997 
D5: Database SWISSPROT, Accession N° P39171, 
01.02.1995 



2.1 The description indicates (on page 4) that the 
technical problem addressed by the present invention 
is that of developing a technical, fermentative method 
for producing biotin with a maximum level of biotin 
synthesis. That problem has been resolved by a biotin 
production method characterised by the expression and 
synthesis of biotin in a host organism based on a 
genetic recombination product containing a SAM (S- 
adenosyl-methionine) synthase gene in combination with 
at least one biotin biosynthesis gene (bioSl,_ bioS2 or 
bioS3) . 



2.2 The subject matter of Claims 1-14 is considered to be 
novel in relation to the prior art. In connection with 
the genetically engineered production of biotin, the 



Form PCT/IPEA/409 (Box V) (January 1994) 



THIS PAGE BLANK (uspto) 



INTERNATIONAL PRELIMINARY EXAMINATION REPORT 



international application No. 
PCT/EP 99/01052 



SAM synthase gene is known from D2 . The bioS gene 
products are also disclosed in prior art (bioSl, see 
D4 ; bioS2, see D5; bioS3, see D3) , though not in 
connection with the production of biotin (with regard 
to WO-A-99/05285, which is cited in the international 
search report as a document belonging to categories P 
and A, see Box VI, below) . Thus, the combination of 
these known genes, as claimed in the genetic 
recombination product of the present application, is 
not disclosed in prior art. 

2.3 The subject matter of the present: versions of Claims 
1-14 does not involve an inventive step in relation to 
the prior art: 

(a) As mentioned above (cf. paragraph 2.2), the bioS 
genes are not described in connection with the 
production of biotin in the prior art documents. 
Furthermore, their combination as claimed in the 
present application is not known. Since the prior art 
indicates that bioS proteins are classed as belonging 
to the nifS protein superfamily (cf. D3, for example), 
the fermentative production of biotin using nifS gene 
products (Dl) could be considered to represent the 
closest prior art. That document refers to S-adenosyl- 
methionine, but not to the SAM-synthase gene. However, 
D2 describes the genetically-engineered production of 
biotin using a recombination plasmid containing the 
SAM-synthase gene and the biotin operon. Since the 
bioS genes can not be inferred directly from Dl and 
D2, the examining authority considers that the subject 
matter of Claims 1-14 involves an inventive step, 
insofar as it is defined only by the bioS genes , and 
not by functional variants, analogues or derivatives 
thereof . 
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(b) The functional variants, analogues or derivatives 
include the known nifS genes (cf. Dl), inter alia. The 
applicants mention this fact on page 5 of the 
description (see 2nd paragraph) . The combination of 
the nifS genes from Dl and the SAM-synthase from D2 is 
obvious to a person skilled in the art, even though 
the nifS genes in Dl come from Klebsiella pneumoniae 
(cf . Dl, example 2, page 6) and not from E. coli , from 
which the bioS genes are derived (according to the 
prior art disclosed in D3, D4 and D5) ; a person 
skilled in the art would be prompted to consider this 
combination (D1-D2) by the biotin operon described in 
the prior art (cf., for example, EP-B-0 236 429 or WO- 
A-94/08023, both of which are cited in the present 
application: see page 3, penultimate paragraph) . In 
WO-A-94/08023, the already cloned biotin synthesis 
genes (e.g. bioA and bioB of the biotin operon) are 
included in a . biotechnological method for producing 
biotin. The bioB gene is also used in Dl, in 
conjunction with nifS. However, in the present 
application, the bioB gene is not mentioned until 
Claim 5. The examining authority nevertheless believes 
that the combination of Dl and D2 using the above- 
mentioned nifS functional variants and the biotin 
operon genes (e.g. bioB) can be considered to be 
obvious. Consequently, the present versions of Claims 
1-14 do not involve an inventive step. 
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Supplemental Box 

(To be used when the space in any of the preceding boxes is not sufficient) 
Continuation of'. 



Box VI. 2 



2.4 WO-A-99/05285 is cited in connection with PCT Rules 
64.3 and 70.10. This application has a publication 
date of 04.02.1999, a filing date of 02.07.1998 and 
a claimed priority date of 22.07.1997; however, in 
the PCT procedure it does not constitute prior art 
for the purpose of the international preliminary 
examination under PCT Article 33(2) and (3). This 
application discloses the bioSl and bioS2 genes in 
connection with the genetically-engineered 
production of biotin. 
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VIII. Certain observations on the international application 

The following observations on the clarity of the claims, description, and drawings or on the question whether the claims are fully 
supported by the description, are made: 

3. Documents D1-D4, which are cited in the search 
report and which disclose the background art, are 
not mentioned in the description (PCT Rule 
5.1(a) (ii) ) . 
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